简书爬虫API实现 (python代码)

in 技术   |    Views

特别喜欢简书这个网站,上面有很多优秀的作者,很多文章也写的非常好。最近想来有空的时候就写了 个简书爬虫,抓取某个专题下的所有文章,为了完整性就完成以下一些功能。

Continue reading

上半年的alphago围棋大战李世石,以4:1的比分大胜李世石——[新浪科技-AlphaGo最终局战胜李世石 人机大战总比分1:4],这也让人工智能再一次的吸引了全世界人的目观,其中的一些词汇也是火了一把,人工智能(Artificial intelligence),深度学习(Deep learning)以及DeepMind。这里稍微解释以上几个词汇。

Continue reading

神经网络模型不仅可以得到语言模型的参数还顺便得到了词向量,即word embedding(南大周志华翻译成词嵌入),亦即得到了词的向量表示。最早用神经网络的思路训练神经网络的模型是百度IDL的徐伟2000提出的。而这篇《A neural probabilistic langulage model》是Bingio在2003年发表在JMLR上的文章。

Continue reading

Word Representation

in NLP   |    Views

任何信息在计算机内的存储方式都是数字,更加具体的说是0-1的二进制码。为了能够让生活中的语言能够存储于计算机中,我们会给所有的字符(包括字母字符,汉子等所有的其他语言文字)一个编码方式

Continue reading

Wen Jun

author.bio


author.job


Anhui, Hefei