强烈建议你试试无所不能的chatGPT，快点击我

【NLP学习笔记】词共现矩阵

阅读量：2135 次

发布时间：2019-04-30

本文共 329 字，大约阅读时间需要 1 分钟。

词共现矩阵定义

通过统计一个事先指定大小的窗口内的word共现次数，以word周边的共现词的次数做为当前word的vector。具体来说，我们通过从大量的语料文本中构建一个共现矩阵来定义word representation。

例子

有语料如下：

I like deep learning.
I like NLP.
I enjoy flying.

则其共现矩阵如下：

在这里插入图片描述

此时选的窗口大小为3，选择在该窗口内词汇的共现频率作为vector。

将共现矩阵行(列)作为词向量表示后，可以知道like，enjoy都是在I附近且统计数目大约相等，他们意思相近。

矩阵定义的词向量在一定程度上缓解了one-hot向量相似度为0的问题，但没有解决数据稀疏性和维度灾难的问题。

转载地址：http://qyugf.baihongyu.com/

你可能感兴趣的文章

java-oracle中几十个实用的PL/SQL

PLSQL常用方法汇总

几个基本的 Sql Plus 命令和例子

PLSQL单行函数和组函数详解

Oracle PL/SQL语言初级教程之异常处理

Oracle PL/SQL语言初级教程之游标

Oracle PL/SQL语言初级教程之操作和控制语言

Oracle PL/SQL语言初级教程之过程和函数

Oracle PL/SQL语言初级教程之表和视图

Oracle PL/SQL语言初级教程之完整性约束

PL/SQL学习笔记

如何分析SQL语句

结构化查询语言（SQL）原理

SQL教程之嵌套SELECT语句

几个简单的SQL例子

日本語の記号の読み方

计算机英语编程中一些单词

JavaScript 经典例子

判断数据的JS代码

js按键事件说明

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-05-18 12:48:53 当前IP: 3.12.153.31 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我