分类 大数据/NLP 下的文章

TensorFlow练习22: 手写汉字识别

MNIST手写数字数据集通常做为深度学习的练习数据集,这个数据集恐怕早已经被大家玩坏了。本帖就介绍一个和MNIST类似,同时又适合国人练习的数据集-手写汉字数据集,然后训练一个简单的Deep Convolutional Network识别手写汉字。识别手写汉字要把识别手写洋文难上很多。首先,英文字符的分类少,总共10+26*2;而中文总共50,000多汉字,常用的就有3000多。其次,汉字有...

继续阅读 »

TensorFlow练习21: 把Deep Dream应用到视频上

前帖<实现谷歌Deep Dream>可以生成扭曲的图像,本帖就基于前一贴的代码在视频上应用Deep Dream,应该能生成比较抽的视频。代码逻辑:使用ffmpeg从视频中提取帧为每一帧图像应用Deep Dream使用ffmpeg把帧图像重新组合成视频,最后和音频合并

继续阅读 »

TensorFlow练习19: 预测天朝铁路客运量

以前做的练习还没有涉及过时间序列数据(洋文Time Series Data),一个最明显的例子是股票价格。时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。一年一度的春节又要来了,火车票已经开售。本帖就简单预测一下未来几个月天朝铁路客运量。铁路客运量历史数据铁路客运量.csv(2005-2016月度数据),数据来源于国家捅计菊。使用matplo...

继续阅读 »

TensorFlow练习18: 根据姓名判断性别

本帖训练一个可以根据姓名判断性别的CNN模型;我使用自己爬取的35万中文姓名进行训练。使用同样的数据集还可以训练起名字模型,参看:TensorFlow练习7: 基于RNN生成古诗词https://github.com/tensorflow/models/tree/master/namignizerTensorFlow练习13: 制作一个简单的聊天机器人准备姓名数据集我上网找了一下,并没有找到...

继续阅读 »

TensorFlow练习17: “声音大挪移”

看见本帖标题,你可能会问:“声音大挪移”是什么鬼玩意,和张无忌有什么关系。如果你没看过鬼畜,先温习两个:【元首】粉红的回忆、【圣地亚哥金曲】客官不可以。(本帖内容和鬼畜关系不大)前文《实现谷歌Deep Dream》可生成带有艺术感的图片。其实,还有另一种合成图片的方式,洋文叫Style Transfer,这种方法需要用到两张图片,如下图: + =

继续阅读 »