机器学习日报 2015-05-18 推荐引擎算法;分词算法;深度学习书;随机森林;Azure 机器学习
机器学习日报 2015-05-18内容更丰富,链接可点击的加长版见 http://memect.co/ml-list-2015-05-18(31条最新动态+焦点, 7条温故知新)
@好东西传送门 出品, 过往目录 见http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报 或点击点我订阅
用日报搜索找到以前分享的内容: http://ml.memect.com/search/
http://tp4.sinaimg.cn/3847741679/50/5710230990/1 数盟社区 网页版 2015-05-18 13:36
算法 应用 推荐系统
【推荐引擎算法学习导论】推荐引擎尽最大努力的收集尽可能多的用户信息及行为,所谓广撒网,勤捕鱼,然后“特别的爱给特别的你”,最后基于相似性的基础之上持续“给力”,原理如下图所示:http://t.cn/R2wfNKnvia.july
http://ww1.sinaimg.cn/large/e557e0efjw1es8cjhbyslj20ju0edq3t.jpg
http://tp4.sinaimg.cn/1884715211/50/5719316060/1 算文解字 网页版 2015-05-18 15:40
算法 资源 自然语言处理 PDF 代码 神经网络
修改了我们的ACL2015文章"Accurate Linear-time Chinese Word Segmentation via Embedding Matching" pdf:http://t.cn/R2A4zyy 把分词看作匹配问题,用无隐层的构架学习"字-状态"组合的embedding,即作输入特征也是待匹配的输出。训练和解码只用贪心算法。 代码还没整理很糙:http://t.cn/R2A4zyU
http://ww4.sinaimg.cn/large/705678cbgw1es8fe4qwg1j21kw12x7bl.jpg
算文解字 网页版 转发于2015-05-18 21:17
Matching更多是一个概念上的尝试,虽然的确也提升了效果。本文的真实动机(除灌水外)其实是想试试看简约的模型(几乎就是embedding版的最大熵模型)配以最懒的推断方法(greedy search)到底能走多远,以及能否用简单的历史状态特征来弥补模型和搜索上的不足。简单的好处是计算快,不用怎么调参。
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页版 2015-05-18 15:39
深度学习 算法 资源 书籍
Wikipedia机器学习迷你电子书之四《Deep Learning》(深度学习),汇总了维基百科上相关的算法、项目、软件、人物,正好100页。通俗易懂,一目了然。微盘链接(可能审核中)http://t.cn/R2AUFPM Memect链接http://t.cn/R2AUFPx
西瓜大丸子汤 网页版 转发于2015-05-18 15:43
这个东西很适合没有专业背景的人来做初步的了解,没有太多坚深的数学,基本讲清楚了是什么,能干什么,谁在干等几个问题。不能替代教科书,不过比看媒体的介绍靠谱多了。
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-05-18 13:55
算法 资源 集成学习 书籍
【迷你书:随机森林入门指南】《An Introduction to Random Forests for Beginners》http://t.cn/R2A7hiJ云:http://t.cn/R2A7SHs
http://ww1.sinaimg.cn/large/5396ee05jw1es8d2c1ou0j20j20b1761.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-05-18 10:14
算法 速查卡
【微软推 Azure 机器学习工具:Algorithm Cheat Sheet 】微软 Azure 的机器学习 Algorithm Cheat Sheet 旨在帮助你筛选可用的机器学习算法,并选择合适的一个来用于预测分析解决方案。http://t.cn/R2hfglZ
页:
[1]