解应春BW 发表于 2015-11-16 09:56:25

机器学习日报 2015-11-15 美国语义产业的“dark side” ;Google BigQuery数据集;TensorFlow实例

机器学习日报 2015-11-15
[*]美国语义产业的“dark side” @西瓜大丸子汤
[*]Google BigQuery数据集 @王威廉
[*]MXNet Data Loading模块的设计文档 @sneakerkg_天骏肖
[*]ACL 2015的录像和ACL Anthology关联 @刘洋THU
[*]TensorFlow实例——K-Means聚类 @爱可可-爱生活

@好东西传送门 出品, 过往目录 见http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

邮件版包括19条,本期的Web版有完整内容24条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp2.sinaimg.cn/1932835417/50/5714878873/1 西瓜大丸子汤 网页链接 2015-11-15 21:34
资源
http://t.cn/RUHOLhR JIST 2015上的讲稿,分享了美国语义产业那些不太上新闻的“dark side”,即那些小公司的成败。丛Project到Business有很大的坎,欧洲作项目多,而美国作商务多。正面的列举了风投亲睐的语义技术、以Locu为例讲了美国的产学研结合。反面的分析了Twine,说明语义应用需要精益Lean
http://ww3.sinaimg.cn/large/7334ba59jw1ey1zb26psij20g20nwgod.jpg

西瓜大丸子汤 网页链接 转发于2015-11-15 21:36
这个是英文的,所以很多地方喷得不尽兴。关于Lean,请参考我以前的博客《瘦语义网的几点想法》http://t.cn/zYz5pJO



http://tp4.sinaimg.cn/1657470871/50/5676743531/1 王威廉 网页链接 2015-11-15 14:51
行业动态
谷歌在较早前参与了GDELT计划,公布了一个Google BigQuery数据集,现提供包括两亿五千万的Event数据, 以及Global Knowledge Graph免费下载。http://t.cn/RZUsd1R
http://ww3.sinaimg.cn/large/62caff97gw1ey1ie4pmp4j20v20h7jws.jpg



http://tp2.sinaimg.cn/2280655377/50/5619151639/1 sneakerkg_天骏肖 网页链接 2015-11-15 10:27
深度学习 视觉 算法
#DMLC#MXNet Data Loading模块的设计文档http://t.cn/RUTRSzg,利用dmlc-core的底层功能实现,在ImageNet数据集上单算loading和preprocessing每秒可以处理3000张图片。希望本文可以帮助大家高效地实现更多机器学习算法所需的IO模块,以充分发挥MXNet通过并行与优化所带来的强大DNN运算性能。


李沐M 网页链接 转发于2015-11-15 10:37
i/o是非常重要的一块。很多时候计算快到飞起,但就是卡在i/o上。良好的格式, 预读,高效的解码都必不可少。

陈天奇怪 网页链接 转发于2015-11-15 11:13
深度学习加速已经快到最后数据读入成为意想不到的瓶颈。要想在单机用300G硬盘训练完整的ImageNet,就是要靠这样经过思考的数据格式。

陈天奇怪 网页链接 转发于2015-11-15 14:34
再次转发一下。mx的io模块就是由@sneakerkg_天骏肖 一手完成的。dmlc因为有优秀的同学的贡献才会有优秀的工具

昊奋 网页链接 转发于2015-11-15 14:52回复 @陈天奇怪 “再次转发一下。mx的io模块就是由...”
开源的力量是不可低估的,也是我认为唯一可以对抗巨头,同时巨头加入也能获益的健康生态



http://tp2.sinaimg.cn/1684294021/50/22843434045/1 刘洋THU 网页链接 2015-11-15 10:03
会议活动 自然语言处理 Yen Kan 会议
#ACL 2015# ACL 2015的录像已经和ACL Anthology关联起来了:http://t.cn/RUTQkyp,大家可以通过ACL Anthology直接访问长文口头报告的视频。感谢@张家俊MT 老师和中科院自动化所的同学手工完成映射工作,感谢新加坡国立大学的Min-Yen Kan教授帮助我们更新ACL Anthology。




http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-11-15 05:30
算法 KNN 聚类
【TensorFlow实例——K-Means聚类】《K-Means Clustering with TensorFlow》by Srjoglekar246http://t.cn/RUTKFa7
http://ww1.sinaimg.cn/large/5396ee05gw1ey17ndvrj3j20b4092q3g.jpg



最新动态
http://tp2.sinaimg.cn/3183064657/50/22833795065/1 算法组 网页链接 2015-11-15 23:41
经验总结 深度学习 博客
『LSTM简介以及数学推导(FULL BPTT) - 数据娃掘的技术博客 - 博客频道 - CSDN.NET』http://t.cn/RUYac6A




http://tp4.sinaimg.cn/3121700831/50/5680619960/1 南大周志华 网页链接 2015-11-15 23:22
会议活动 ICDM Robert Engle 会议
诺贝尔经济学奖得主Robert Engle 在IEEE数据挖掘大会(ICDM 2015)做第一个主旨报告,介绍基于数据分析进行金融危机预警。在时序数据上考虑时间因素的动态相关分析很有用。报告提到,目前金融风险最大的看似中国,但在考虑经济规模规范化之后法英等国风险更大。
http://ww3.sinaimg.cn/large/ba115fdfjw1ey21w06jz4j218g0xcgv7.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-11-15 21:36
资源 Andreas Mueller 代码 幻灯片 课程 数据科学
【IPN:Scikit-learn教程资料(开放数据科学大会ODSC 2015)】"Slides and Notebooks for Open Data Science Conference - Materials for the Scikit-learn tutorial at ODSCON San Francisco 2015" by Andreas Mueller GitHub:http://t.cn/RUHOaYq




http://tp1.sinaimg.cn/2536116592/50/5716095299/0 iB37 网页链接 2015-11-15 21:17
Robert Kass 教育网站 统计
关注统计教育的CMU教授Robert Kass在11年的StatSci<统计推断:大宏图>里提到,如今统计学不应再以频率还是贝叶斯为争,而应该将联系统计模型和观察数据的“统计实用主义”作为统计推断的基础。另外,Kass等著的14年书 <Analysis of Neural Data>配套网站附有各章节图片的代码。 http://t.cn/RUHp4XI
http://ww1.sinaimg.cn/large/972a1170jw1ey1yzniic0j20ze0kw474.jpg



http://tp4.sinaimg.cn/1970879995/50/1298114627/1 孙茂松 网页链接 2015-11-15 20:51
会议活动 自然语言处理 CCL 会议 活动 教育网站 王士元 语言学
由中国中文信息学会主办的全国第十四届计算语言学会议(CCL 2015)及第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD 2015)11月12-14日在广州外语外贸大学成功举行,与会代表约500人。图为世界著名语言学家王士元先生在做主旨报告。 http://t.cn/RUOooum
http://ww4.sinaimg.cn/large/75793dfbgw1ey1y9a5twdj21kw16odol.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-11-15 20:09
深度学习 视觉 Christopher D. Manning Christopher Manning 语言学
【(Manning)计算语义学与深度学习】《Computational Linguistics and Deep Learning》by Christopher D. Manning (MIT Press Journals 2015) http://t.cn/RUHaLHV 视频请参阅:http://weibo.com/1402400261/D03j502Ww




http://tp4.sinaimg.cn/1926267847/50/1296649990/1 冯志伟文化博客 网页链接 2015-11-15 19:15
经验总结 自然语言处理 博客 冯志伟
发表了博文《自然语言复杂性研究的参考文献》自然语言复杂性研究的参考文献冯志伟自然语言复杂性研究的参考文献如下,希望有兴趣者进一步研究这个问题。1.Abney,S.P.,McAllester,D.A.,http://t.cn/RUHMYhz
http://ww1.sinaimg.cn/large/72d083c7jw1ey1vhzi9qhj20j60edace.jpg



http://tp4.sinaimg.cn/1772191555/50/5708175819/1 Linux中国 网页链接 2015-11-15 14:10
深度学习 李理
揭秘 TensorFlow:Google 开源到底开的是什么? - 作者:雷锋网/李理 | 这两天发现朋友圈被Google开源深度学习系统TensorFlow的新闻刷屏了。这当然是一个很好的消息,尤其对我们这种用机器学习来解决实际问…http://t.cn/RUTFS5y
http://ww3.sinaimg.cn/large/69a17f43jw1ey1modzxquj20kk08l75x.jpg



http://tp2.sinaimg.cn/2151877461/50/5741932408/1 数据娃掘-刘壮 网页链接 2015-11-15 12:33
经验总结 自然语言处理 博客
常用NLP知名研究机构 - 数据娃掘的技术博客 - 博客频道 - CSDN.NET http://t.cn/RUTrTbH




http://tp2.sinaimg.cn/1633090481/50/5720726702/1 KevinQuant 网页链接 2015-11-15 11:16
应用 推荐系统
美团推荐与个性化团队技术经理沈国阳来到CSDN在线视频分享平台,为我们深度解析美团本地生活服务推荐的工作经验,并与群友进行互动交流。沈国阳重点介绍了美团推荐系统的架构和特色,以及在排序层面的主要工作。 http://t.cn/RL1tKnj




http://tp4.sinaimg.cn/1646706835/50/40090027455/1 hbyido 网页链接 2015-11-15 08:48
算法 强化学习
Nice and practical reinforcement learning series; Learning +ANNhttp://t.cn/RUf7efo http://t.cn/RUTjTYE




http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-11-15 07:06
会议活动 入门 深度学习 算法 知识工程 资源 幻灯片 活动 简报 课程 神经网络 知识库
第422期机器学习日报(2015-11-14)http://t.cn/RUTplQg 1) 第三届全国中文知识图谱研讨会slides 2) Awesome RNN系列 3) LSTM简介以及数学推导 4) 台湾大学“机器学习技法”课程 5) 和深度神经网络下围棋 完整版18条http://t.cn/RUTplQD
http://ww1.sinaimg.cn/large/005HjjGQgw1ey1afo5u5yj30f109hdhb.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-11-15 07:01
资源 Xavier Amatriain 幻灯片
【幻灯:Xavier Amatriain机器学习系统10点心得(新)】《10 more lessons learned from building Machine Learning systems》by Xavier Amatriain http://t.cn/RUTp6XN 云:http://t.cn/RUTpxks 参阅http://weibo.com/1402400261/C5aBXayLa
http://ww3.sinaimg.cn/large/5396ee05gw1ey1a9tbtqyj20hq09zgmx.jpg



http://tp3.sinaimg.cn/2009557502/50/5615087248/1 HackerNewsDaily 网页链接 2015-11-15 03:20
会议活动 深度学习 视觉 资源 ICCV PDF 会议
《Deep Neural Decision Forests 》原文:http://t.cn/RUjOYPJ HN评论:http://t.cn/RUTigIP






页: [1]
查看完整版本: 机器学习日报 2015-11-15 美国语义产业的“dark side” ;Google BigQuery数据集;TensorFlow实例