解应春BW 发表于 2015-8-19 09:16:25

机器学习日报 2015-08-18 Random Forest 与 GBDT 的异同;人工智能平台DTPAI;Quora 是如何使用机器学...

机器学习日报 2015-08-18
[*]Random Forest 与 GBDT 的异同 @请叫我卫小华
[*]阿里云发布人工智能平台DTPAI @阿里云
[*]神经机器翻译中的注意机制 @闫安Jon
[*]黄志恒的工作(NLP,语音识别,深度学习等) @iB37
[*]Quora 是如何使用机器学习的? @伯乐在线官方微博

@好东西传送门 出品, 过往目录 见http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

邮件版包括20条,本期的Web版有完整内容30条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp2.sinaimg.cn/2417852633/50/22829641364/1 请叫我卫小华 网页链接 2015-08-18 13:31
经验总结 算法 博客 集成学习
最近看到一个群里有人讨论RF和GBDT异同,我就写了一篇 《Random Forest 与 GBDT 的异同 》http://t.cn/RLga4Ay @NLPJob @爱可可-爱生活 @好东西传送门 [嘻嘻][嘻嘻]




http://tp4.sinaimg.cn/1644971875/50/40056469937/0 阿里云 网页链接 2015-08-18 16:14
深度学习 算法 行业动态 特征工程
【阿里云发布人工智能服务DTPAI】8月18日,阿里云宣布推出国内首个人工智能平台“DTPAI”。开发者可通过简单拖拽的方式完成对海量数据的分析挖掘,以及对用户行为、行业走势等的预测。平台将集成阿里巴巴核心算法库,包括特征工程、大规模机器学习、深度学习等。
http://ww4.sinaimg.cn/large/620c4763jw1ev6u4fl3coj213e4di4qr.jpg



http://tp3.sinaimg.cn/5648620342/50/5731472374/1 闫安Jon 网页链接 2015-08-18 10:29
算法 自然语言处理 机器翻译 论文 神经网络
Effective Approaches to Attention-based Neural Machine Translation http://t.cn/RLgcXK1 斯坦福NLP组比较了机器翻译中的注意机制,发现预测性的局部机制(对每个目标词生成源句中需注意的窗口及权重)效果突出。附带各种技术的8模型组合达到目前WMT14/15英德最佳水平。
http://ww1.sinaimg.cn/large/006ah2bIjw1ev6k2qjpmzj30ad0dz756.jpg

张家俊MT 网页链接 转发于2015-08-18 13:51回复 @尚利峰_FUNG “转发微博”
欣喜的同时,发现这套模型越做越复杂



http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页链接 2015-08-18 09:00
深度学习 算法 CRF 行业动态
微软深度学习开源工具包CNTK开发者、百度研究院主任结构师 Bidirectional LSTM-CRF Models for Sequence Tagging 组合可捕捉过去和将来输入特征的双向LSTM和可捕捉句子级标签信息的CRF,最后再加入MaxEnt特征到网络输出层. 对词嵌入健壮 http://t.cn/RLgbYKG 附: ASRU13并行RNNLM代码
http://ww1.sinaimg.cn/large/972a1170gw1ev6h8riem4j218s0qdahz.jpg

fengyuncrawl 网页链接 转发于2015-08-18 19:08
可以比较一下俄罗斯最大搜索引擎Yandex刚开源的faster-rnnlm source code :http://t.cn/RLgEXcj

iB37 网页链接 转发于2015-08-18 19:28回复 @fengyuncrawl “可以比较一下俄罗斯最大搜索引擎...”
yandex: Faster Recurrent Neural Network Language Modeling Toolkit with Noise Contrastive Estimation and Hierarchical Softmax



http://tp2.sinaimg.cn/1670481425/50/1286328769/1 伯乐在线官方微博 网页链接 2015-08-18 08:50
经验总结 博客
《Quora 是如何使用机器学习的?》很多朋友都应该用过 Quora (或知乎)吧,对于问答网站,会在哪些方面用上机器学习呢?大家可先想想看。[思考] Quora 工程副总将在本文分享他们使用的经验……全文:http://t.cn/RLdDRYu (@人墙裂 译,欢迎加入翻译组http://t.cn/R2azJxi )
http://ww1.sinaimg.cn/large/63918611gw1ev6h5ta6pxj206e03mq2z.jpg



最新动态
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页链接 2015-08-18 23:29
会议活动 架构 资源 CIKM PDF Spark 行业动态 会议 教育网站 李航
十月19-23澳大利亚墨尔本CIKM-15录用论文 http://t.cn/RLqUBmX 机器学习挑战:预测澳式橄榄球赛结果. 附1:华为诺亚方舟李航老师将做工业talk,NativeX和UC伯克利Shanahan有Spark、谷歌Vassilvitskii有MapReduce专题讲座. 附2:平均录用率17% http://t.cn/RLevRe4 平均引用次数5.9 http://t.cn/RLevReU
http://ww4.sinaimg.cn/large/972a1170gw1ev75ptu51gj21970pf4b3.jpg



http://tp2.sinaimg.cn/2445412693/50/40052945201/1 anklebreaker11 网页链接 2015-08-18 21:25
经验总结 应用 资源 R语言 博客 课程 社交网络
@bitslife 随便看看 分享自Conda 《R语言 调用pubmed查询结果构建科学家社交网络》 - @Conda 恰好留出了大量的时间给我闲。趁着这个辞职的间歇,学了一些coursera课程,抓紧给自己充电,也玩了一... (来自 @头条博客) - http://t.cn/RwjRv2m
http://ww2.sinaimg.cn/large/91c20955jw1ev733wq2zdj20j60j6dgc.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-08-18 19:55
算法 资源 Tao Junjie 书籍 统计
【IPN:(中文)Scikit-Learn实用案例(第二章)】《Scikit-Learn Cookbook》案例中文版 翻译:Tao Junjie 第二章:处理线性模型 "从最简单的数据直线拟合模型到分类模型,最后介绍贝叶斯岭回归" http://t.cn/RLgme8W 第一章:http://weibo.com/1402400261/CvwktD6NN
http://ww1.sinaimg.cn/large/5396ee05jw1ev70fqyho6j20b90dwwh0.jpg



http://tp3.sinaimg.cn/1286528122/50/40028223938/1 微软亚洲研究院 网页链接 2015-08-18 19:00
视觉
2015#微软学生夏令营#今天Hacker车库正式启动,营员们以"痛并快乐"为主题,针对身边的痛点提出奇思妙想。针对学校内打印的困难,中山大学的同学们仿照自动售货机提出二维码无人打印,令云打印成为可能。有感于微软的诸多科技,西安交大的同学们提出利用HoloLens记录笔迹自动形成OneDrive上共享的笔记。
http://ww3.sinaimg.cn/large/4caedc7agw1ev6ywwx4u6j20uu3b6x4w.jpg

微软亚洲研究院 网页链接 转发于2015-08-18 19:01
而对于不良坐姿产生的健康危害,华南理工大学的同学们结合智能硬件,提醒用户注意运动、调整坐姿,杜绝程序员的职业病"颈椎病"的发生。相信在同学们脑力与创新的碰撞下,一定会产生更多的精彩作品!



http://tp4.sinaimg.cn/2665496671/50/5729322057/1 经济和信息化在线-上海 网页链接 2015-08-18 17:50
资源 数据
【上海开放数据创新应用大赛8月18日正式开赛】#温馨提示#本次大赛以城市交通为主题,整合了来自上海公安等机构的海量开放数据,其中许多数据集在国内属于首次开放,其蕴含的社会价值、科研价值和商业价值正静待广大参赛者深入挖掘、充分利用。http://t.cn/RLgHIXe




http://tp2.sinaimg.cn/2709534981/50/40067745451/1 DataREPL 网页链接 2015-08-18 17:11
经验总结 算法 资源 博客 课程 书籍
一直要看PRML的,今天读论文发现 variational algorithm for ap- proximate posterior inference(通过变分算法近似后验概率推断)怎么都搞不懂,然后看到了PRML读书会的一篇博文,进而找到了这个目录http://t.cn/RZgh19l,慢慢啃




http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页链接 2015-08-18 13:33
会议活动 自然语言处理 EMNLP 会议 机器翻译
神经机器翻译<ACL15缓解稀有词/未登录词http://weibo.com/2536116592/CrH0EqJUy >作者新品 Effective Approaches to Attention-based Neural Machine Translation http://t.cn/RLgaf8Qattention指在翻译过程中有选择性的重点关注源语言句子里的某些部分:全局法 & 局部法
http://ww2.sinaimg.cn/large/972a1170gw1ev6pdqxfxdj21d40d8gqp.jpg



http://tp1.sinaimg.cn/2841943860/50/40009486090/1 微软研发 网页链接 2015-08-18 11:11
微软发动"隐形革命",#智造未来#![瞧瞧]Microsoft全球执行副总裁沈向洋把微软正在经历的革新比作一场”隐形的革命”:通过实现产品和服务的”云化”,使计算得以隐形;通过机器学习和自然交互界面,使计算更具预测性和个性化。我们要让体验超越设备,重新定义微软的竞争力! [给力]http://t.cn/RLgfN2k
http://ww3.sinaimg.cn/large/a9649f34gw1ev6ld0yef2j20go0atgly.jpg



http://tp3.sinaimg.cn/5648620342/50/5731472374/1 闫安Jon 网页链接 2015-08-18 09:25
深度学习 算法 论文 神经网络
Online Representation Learning in Recurrent Neural Language Models http://t.cn/RLgGDdv 在RNNLM的基础上增加doc向量,测试期每句开始时为缺省值,每读一个单词后预测下一个,误差反传回doc。好处是分担了RNN对个别句子的编码,更省内存和参数,不过应用时较费时费电。
http://ww3.sinaimg.cn/large/006ah2bIjw1ev6i8e7zcfj30ac07jdfy.jpg



http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页链接 2015-08-18 09:25
会议活动 视觉 算法 资源 CVPR ICML PDF 会议 教育网站 神经网络
图片加说明Image Captioning. Phrase-based http://t.cn/RLgGDHr Neural http://weibo.com/2536116592/Bxly7aXbm Visual-Semantic Alignments http://t.cn/RAkrkB9 Image Representations & New Domains http://t.cn/RLgGDHB
http://ww1.sinaimg.cn/large/972a1170gw1ev6i5bmsfij21f30lx789.jpg



http://tp2.sinaimg.cn/3210832433/50/22831251154/1 清华计算机系校友会 网页链接 2015-08-18 08:57
会议活动 应用 自然语言处理 SIGIR 会议 教育网站 刘奕群 信息检索
日前,在2015年信息检索领域国际顶级会议SIGIR(国际计算机学会信息检索专委会年度会议)上,计算机系师生撰写的论文“Incorporating Non-sequential Behavior into Click Models”(作者:王超、刘奕群、马少平等)获最佳论文提名奖。 http://t.cn/RLgbNZL @马少平THU @刘奕群THU
http://ww2.sinaimg.cn/large/bf616a31jw1ev6hb33qg9j20on0j3djs.jpg

自动化网官方微博 网页链接 转发于2015-08-18 13:52回复 @马少平THU “@自动化学院派”
在智利圣地亚哥刚刚结束的2015年信息检索领域国际顶级会议SIGIR(国际计算机学会信息检索专委会年度会议)上,计算机系师生撰写的论文“Incorporating Non-sequential Behavior into Click Models”(作者:王超、刘奕群、马少平等)获得最佳论文提名奖。



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-08-18 08:18
深度学习 算法 资源 Python 课程 神经网络
【深度学习入门资料精选(二)】Theano (python) CNN tutorial:http://weibo.com/1402400261/BFBCwg9sU 《Deep Learning》http://weibo.com/1402400261/CsoSyrHvm 《Neural Networks and Deep Learning》http://weibo.com/1402400261/C0S24wPGu 牛津深度学习课程:http://weibo.com/1402400261/Ca8xX5m8V




http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-08-18 08:01
深度学习 资源 课程
【深度学习入门资料精选(一)】Stanford UFLDL tutorial:http://weibo.com/1402400261/BFmm90gXu Brief history of Deep Learning:http://weibo.com/1402400261/CwltXzY3l http://weibo.com/1402400261/CwlHnnDjw 《Deep Learning: Methods And Applications》http://weibo.com/1402400261/BFiHGE4iI




http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-08-18 06:55
资源 自然语言处理 简报 课程
第333期机器学习日报(2015-08-17)http://t.cn/RLg21ui 1) 词向量近期干货总结 2) 英语POS tagging工具FLORS 3) 短文本摘要数据集 4) 斯坦福NLU2015课程 5) 整合信息理论与意识 完整版30条 http://t.cn/RLg21uJ
http://ww2.sinaimg.cn/large/005HjjGQgw1ev6dyqs00zj30ql0fwtdg.jpg



http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-08-18 06:54
资源 自然语言处理 课程 情感分析
第64期NLP日报(2015-08-17) 1) 英语POS tagging工具: FLORS 2) 词向量近期干货总结 3) 超过200万的短文本摘要数据集 4) 斯坦福Nautural Language Understanding课程 5) 关于情感分析,你不得不知道的11件事 完整版13条 http://t.cn/RLg23Bq
http://ww3.sinaimg.cn/large/005HjjGQgw1ev6dy1wc25j30w8062wgk.jpg





页: [1]
查看完整版本: 机器学习日报 2015-08-18 Random Forest 与 GBDT 的异同;人工智能平台DTPAI;Quora 是如何使用机器学...