解应春BW 发表于 2016-2-6 19:13:48

机器学习日报 2016-02-05 无监督计算机视觉最新进展;RNN/LSTM/RNN局限性及DNN语言处理展望

机器学习日报 2016-02-05
[*]幻灯:无监督计算机视觉最新进展 @爱可可-爱生活
[*]机器学习集成方法 @爱可可-爱生活
[*]大神视频:(Mikolov)RNN/LSTM/RNN局限性及DNN语言处理展望 @爱可可-爱生活
[*]降维及其应用 @爱可可-爱生活
[*]声音:人工智能正改变谷歌搜索,而下一个目标则是整个互联网 @爱可可-爱生活

@好东西传送门 出品, 过往目录 见http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

邮件版包括20条,本期的Web版有完整内容31条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-02-05 06:28
经验总结 视觉 博客
【幻灯:无监督计算机视觉最新进展】《Unsupervised Computer Vision: The State of the Art | Stitch Fix Technology – Multithreaded》by TJ TORRES http://t.cn/RGPvCoF 云:http://t.cn/RGPvCok
http://ww3.sinaimg.cn/large/5396ee05jw1f0o2382x80j20hq09zgmv.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-02-05 08:43
集成学习
【机器学习集成方法】《Ensemble Methods: Elegant Techniques to Produce Improved Machine Learning Results | Toptal》by Necati Demir pdf:http://t.cn/RGPbXr3 http://t.cn/RGP4Fqu
http://ww2.sinaimg.cn/large/5396ee05jw1f0o61hcv0fj20ht0htjti.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-02-05 07:39
深度学习 资源 Tomas Mikolov 视频
【视频:(T Mikolov)RNN/LSTM/RNN局限性及DNN语言处理展望】《Recurrent Networks and Beyond - Tomas Mikolov - YouTube》by Tomas Mikolov http://t.cn/RGPZZVP 云:http://t.cn/RGPZZVv




http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-02-05 05:05
深度学习
【降维及其应用】《Understanding Dimensionality Reduction and its Applications - Dataconomy》by Dmitry Storcheus http://t.cn/RGvFwON
http://ww3.sinaimg.cn/large/5396ee05jw1f0nzqrtqg0j20dv0af0tz.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-02-05 04:48
应用 信息检索
【人工智能正在改变Google搜索,web其他领域的变革指日可待】《AI Is Transforming Google Search. The Rest of the Web Is Next | WIRED》by Cade Metz http://t.cn/RGvk8fc
http://ww1.sinaimg.cn/large/5396ee05jw1f0nz7kjpznj20sg0npaqa.jpg

爱可可-爱生活 网页链接 转发于2016-02-05 19:58
@机器之心synced 提供的译文《人工智能正改变谷歌搜索,而下一个目标则是整个互联网》http://t.cn/RGhZogy



最新动态
http://tp2.sinaimg.cn/1932835417/50/5714878873/1 西瓜大丸子汤 网页链接 2016-02-05 22:27
知识工程 资源 知识库
上次的讲座 http://t.cn/RbrM2Yu 提到知识图谱开发的核心是迭代,稍作补充:线上可用的系统,一般经过统计、规则、编辑三步提取。统计方法粗过一遍,但一般难以达到可用程度,后面还是要靠人工。规则是可重复的人工投资,编辑是不可重复的人工。迭代就是提高可重复的人工投资的比例,并反馈到统计系统
http://ww2.sinaimg.cn/large/7334ba59jw1f0otv4qv72j20l50f4dgv.jpg

西瓜大丸子汤 网页链接 转发于2016-02-05 22:33
拿炼钢做比喻。统计相当于选矿,提供些可用的原材料。规则相当于炼出铁,勉强可用。编辑相当于锻打,让材料达到做零件可用的特性。我们要用各种方法来改进炼铁和锻打的效率,但是这不是加强选矿就能替代的。有多少人工才有多少智能。

西瓜大丸子汤 网页链接 转发于2016-02-05 22:38
迭代的目的是控制成本。从字符串到URI有巨大的成本。分类是一种,实体识别是一种。很多时候我们并不需要精确的URI,而只需要用户可感知的满意度。我们没有必要过度优化。我们也完全可能统筹统计、规则、编辑来降低成本

西瓜大丸子汤 网页链接 转发于2016-02-05 22:41
极少可能我们一下子就知道该用什么方法。应该先用小的数据集来人工的观察,人工的来标注。找到数据的感觉。很少有情况我们基于常识不能发现一些规律的。用这些早期的发现来bootstrap,构造规则或者统计系统来渐次减少人工观察的比重。用好Faceted Browser和Excel表格这些能快速发现数据规律的工具

西瓜大丸子汤 网页链接 转发于2016-02-05 22:49回复 @西瓜大丸子汤 “在HCI工具上要积累。观察数据的工...”
比如Ayasdi分析系统的核心不仅是数据拓扑分析,而且是它的多分辨率可视化算法,工程师可以多角度快速发现数据规律。这些规律是机器很难发现的。

西瓜大丸子汤 网页链接 转发于2016-02-05 22:57回复 @西瓜大丸子汤 “迭代的目的是控制成本。从字符串...”
实体Entity是URI的另一个说法而已。语义网多年的惨痛教训已告诉我们不能过于实体化。字符串到实体要尽可能在应用部署中迭代进行,千万不能上来就想构造实体的网络

西瓜大丸子汤 网页链接 转发于2016-02-05 22:58回复 @西瓜大丸子汤 “实体Entity是URI的另一个说法而已...”
“构成这个世界的是实体,而非字符串” 这句Google的名言是有适用范围的。不小心就栽坑里了



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-02-05 20:59
深度学习 视觉 可视化
48小时分享排行:​ No 1. 【20个最佳大数据可视化工具概览】 No 2. 《最全的深度学习硬件指南》 No 3. 【数据挖掘相关的数学基础】 No 4. 【Boosted Trees介绍】 No 5. 【幻灯:无监督计算机视觉最新进展】 ……http://t.cn/RGhu4KG




http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-02-05 20:25
深度学习 算法 论文 强化学习
【论文:深度强化学习异步算法(多核单CPU高效多线程)】《Asynchronous Methods for Deep Reinforcement Learning》V Mnih, A P Badia, M Mirza, A Graves, T P. Lillicrap, T Harley, D Silver, K Kavukcuoglu (2016) http://t.cn/RGh8Cga
http://ww3.sinaimg.cn/large/5396ee05jw1f0oqb7n3udj20hl09l77i.jpg



http://tp4.sinaimg.cn/1884715211/50/5747079226/1 算文解字 网页链接 2016-02-05 17:33
会议活动 深度学习 ICLR 会议 论文
Deep Mind去年9月份被@爱可可-爱生活 和@好东西传送门 推荐过的一篇用LSTM + attention做entailment/蕴含推理的文章这周被ICLR 2016录用了。文章链接: http://t.cn/Ry6vqfK
http://ww4.sinaimg.cn/large/705678cbgw1f0ola35as8j20hr0c20v4.jpg



http://tp3.sinaimg.cn/1815070622/50/5736692914/1 Google谷歌爱好者 网页链接 2016-02-05 17:21
John Giannandrea
从 Amit Singhal 到 John Giannandrea,很多人把这个举动看作是机器学习引领搜索引擎未来的信号。就解决 Google 搜索引擎发展过程中所遇到的问题而言, Google 的这一举动既是领导权的转移,同时也是领导者所属部门的转移…… http://t.cn/RGhxlfx




http://tp2.sinaimg.cn/1713166925/50/5690897784/1 冯剑HIT 网页链接 2016-02-05 17:18
自然语言处理 Python
『用Python做自然语言处理,你不知道这8个工具就Out了』http://t.cn/RGPMVPl




http://tp4.sinaimg.cn/5546539755/50/5720877588/1 黄广斌-ELM 网页链接 2016-02-05 16:58
深度学习 算法 ELM GPU
最新消息:即将发表在某IEEE Transactions的文章显示,在几个交通路牌识别数据集测试中,基于超限学习机(ELM)准确率比深度学习高,而学习时间从基于GPU的深度学习几十小时缩短到基于CPU的ELM的200秒左右,考虑到GPU和CPU速度的区别,基于ELM的实现实际把训练速度约提高了几万倍,祝贺相关研究团队!




http://tp1.sinaimg.cn/1746173800/50/5746256057/1 InfoQ 网页链接 2016-02-05 16:00
自然语言处理 R语言 情感分析
【R语言中的情感分析与机器学习】利用机器学习可以很方便的做情感分析。本文将介绍在R语言中如何利用机器学习方法来做情感分析。 http://t.cn/RbFBjgJ
http://ww1.sinaimg.cn/large/68147f68gw1f0nn5ai5wlj202s01ydfm.jpg



http://tp1.sinaimg.cn/1746173800/50/5746256057/1 InfoQ 网页链接 2016-02-05 14:00
自然语言处理 机器翻译
【浅谈机器翻译之瓶颈及目前的研发趋势】机器翻译是个很吸引人的研究题材,但却因为自然语言中的歧义和语法不合设定问题,而造成研发上的障碍。近年来,由于语料库资源的快速发展,可从双语语料库内自动抽取知识的参数式系统,逐渐取代了传统的规则库系统,成为研发的主流。 http://t.cn/RbsAfQe
http://ww4.sinaimg.cn/large/68147f68gw1f0nn43tqohj202s01vmwx.jpg



http://tp2.sinaimg.cn/1785748853/50/40004237873/1 星空下的巫师 网页链接 2016-02-05 08:55
深度学习
过年了,大神们都不让人消停,Facebook也发布了他们基于torch训练的ResNet模型,性能还要优于kaiming自己发布的那个版本。 http://t.cn/RLPSXdW




http://tp4.sinaimg.cn/1657470871/50/5676743531/1 王威廉 网页链接 2016-02-05 08:32
深度学习 视觉 代码
脸书派人把今年微软研究院获得ImageNet冠军http://memect.com/sendy/t/k1RRYXYIf2NXyKNYX4akNg/hXHC763WzH0LzxoQvKW8xAFQ




页: [1]
查看完整版本: 机器学习日报 2016-02-05 无监督计算机视觉最新进展;RNN/LSTM/RNN局限性及DNN语言处理展望