数据并不是万能的。 2010年12月,谷歌与哈佛大学合作推出了科学实验项目“Google Ngram Viewer”,中文翻译为“谷歌图书词频统计器”。 简而言之,这个统计器是针对图书出版物的一种“谷歌趋势 ...
原标题:如何利用词频写好解读类文章 快速、准确地统计出词频数据是解读类文章的基础,要想事半功倍必须熟练掌握统计工具。 简单堆砌词频数据很难吸引读者,第一步要筛选出最能支持 ...
今年的政府工作报告有哪些高频词?较往年有何变化?又有哪些新概念、新提法?南都大数据研究院对2016年至今的政府工作报告进行了文本分析发现,“科技”“安全”“投资”“消费”等热词词频创近10年新高,“智能经济新形态”“中小学春秋假”“初婚初育家庭住房保障”等多个提法首次在报告中出现,突出体现改革创新、民生为大等鲜明特点。
(记者金煜)谷歌本周推出了与哈佛大学合作的科学实验项目“图书词频统计器”,可对1800年到2000年世界上4%的图书,共计5亿个词汇进行词频统计,查看语言和文化的发展趋势,实验基于谷歌图书 ...
本研究针对情绪词在自然句子阅读中的加工机制,通过眼动追踪技术首次探讨了情绪典型性(EmoPro)对汉语阅读的影响及其与词频的交互作用。研究发现,高EmoPro词能更高效激活情绪语义,吸引 ...
前一阵子有一篇热文,小学生用大数据分析苏轼,说的就是清华附小的学生用词频分析方法对苏轼的作品进行了分析,很多网友解嘲说感觉智商遭到了暴击,那么什么是词频分析呢? 前一阵子有 ...
本研究通过分析英语(Nationwide Speech Project语料库)和波兰语(Greater Poland Spoken Corpus语料库)的非脚本语音数据,探讨了语境信息量(informativity)与词频对词汇时长的调控作用。研究发现,高频 ...
词频统计分析是文本挖掘的关键手段,通过统计关键词出现频率的变化,识别热点话题及其发展趋势。 1、 最近沉迷周杰伦的音乐,想研究他歌词中常出现的词汇。 2、 分析淘宝国产手机用户 ...
源自人为生成的语料库的词嵌入,具有很强的性别偏见,而且这种性别偏见会被下游模型进一步放大。我们发现语料库的规律性如词频等,会对现有的事后比较去偏算法(post-hoc debiasing algorithms ...
Some results have been hidden because they may be inaccessible to you
Show inaccessible results