机器学习日报 2015-07-25 RNN以及LSTM公式梳理;ICML 2015压轴讨论;人脸检测和识别Web API汇总
机器学习日报 2015-07-25[*]RNN以及LSTM的介绍和公式梳理 @DarkScope
[*]ICML 2015压轴讨论总结:6大神畅谈深度学习的未来 @马少平THU
[*]人脸检测和识别的Web服务API汇 @视觉机器人
[*]ZS压缩的Google Books Ngram数据集 @爱可可-爱生活
[*]概率图模型(PGM)有必要系统的学习一下么? @谢澎涛CMU
@好东西传送门 出品, 过往目录 见http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报
邮件版包括20条,本期的Web版有完整内容21条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp3.sinaimg.cn/2421424850/50/5680170828/1 DarkScope 网页链接 2015-07-25 16:36
经验总结 深度学习 博客
最近看了不少RNN的,记录一下~~~~~《RNN以及LSTM的介绍和公式梳理》 - DarkScope从这里开始 - 博客频道 - CSDN.NET http://t.cn/RLaYG20
http://ww3.sinaimg.cn/large/905402d2jw1euf3vu7pm8j21180iyjtt.jpg
http://tp3.sinaimg.cn/1929644930/50/1299488543/1 马少平THU 网页链接 2015-07-25 11:39
会议活动 深度学习 Elon Musk ICML Stephen Hawking 会议
【ICML 2015压轴讨论总结:6大神畅谈深度学习的未来】 http://t.cn/RLaJAvQ
吴甘沙 网页链接 转发于2015-07-25 12:13
重点:NLP(问答和对话),顺序决策,无监督学习。DL应用于人类不擅长的任务(“非认知”任务),如医药医疗健康。避免过度炒作、又加快研究的解决方案是开放的审查制度。不会有第三个AI/NN冬天。多数公司痛苦于数据太多,这对缺乏数据的学术研究是福音。积极探索、积累知识并获得奖励,机器人如此工作
吴甘沙 网页链接 转发于2015-07-25 12:30
另一个焦点是AI fear。DeepMind的Hassabis搞定了Elon Musk,Stephen Hawking。区分intelligence和quality,人类社会的问题由quality导致,而现在大家归因于intelligence并害怕AI。AI agent只对其他agent感兴趣,对人类无感。机器形成思维是渐进的,而不是爆发的(这与《超级智能》观点相左)
http://tp1.sinaimg.cn/5501429448/50/5717596146/1 视觉机器人 网页链接 2015-07-25 09:48
视觉 行业动态
人脸检测和识别的Web服务API汇总:http://t.cn/RLa5sbE 。汇总了全球范围内提供基于Web服务的人脸检测和识别的API,便于网络中快速部署和人脸相关的一些应用。包含比较知名的Face++、Project Oxford、linkface等,以及百度即将开放的人脸识别API。
http://ww4.sinaimg.cn/large/0060jr72gw1eues3cokv8j30qi0e2jw8.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-07-25 06:35
教育网站
【ZS压缩的Google Books Ngram数据集】http://t.cn/RLa2z8r ZS格式说明:http://t.cn/RLa2z8B Google Books Ngram:http://t.cn/RvRSPde
http://tp2.sinaimg.cn/1822644165/50/5721134806/1 谢澎涛CMU 网页链接 2015-07-25 00:40
算法
我在 @知乎 回答了问题: 概率图模型(PGM)有必要系统的学习一下么? 很高兴看到有人提这个问题。概率图模型(PGM)是我的研究方向(发表的9篇论文中7篇是PGM),也曾做过CMU PGM这门课的TA,对这个方向深深喜爱。 先说说PGM的重要性。概率图… http://t.cn/RLXFQWU 来看看!
陈天奇怪 网页链接 转发于2015-07-25 07:14
PGM的一个短板是不大众化,加特征 加神经网络 大家都会。容易根据领域定制。如果概率编程高效之后或许PGM也会更加实用/@老师木:我也喜欢
孙明明_SmarterChina 网页链接 转发于2015-07-25 08:33回复 @歌之忆 “概率图模型也是数据压缩、信道编...”
pgm非常重要。统计推断领域的作用无可替代
孙明明_SmarterChina 网页链接 转发于2015-07-25 08:38回复 @hbyido
在当前工业界面临的分类,回归,排序任务里,pgm学习范式并不占优。但在知识图谱统计推断领域,pgm范式是适合的。
最新动态
http://tp2.sinaimg.cn/1785748853/50/40004237873/1 星空下的巫师 网页链接 2015-07-25 22:41
代码
Facebook natural image generation using ConvNets, code: http://t.cn/RLaFaS2
http://tp1.sinaimg.cn/1181564472/50/5714573383/1 ML_Yuens 网页链接 2015-07-25 19:50
资源 自然语言处理 数据
【数据集】中英文新闻语料 http://t.cn/RLa3z0k 【数据集】国内外语料库汇总 http://t.cn/RLa3z0D 【数据集】千万级汉语词库分享 http://t.cn/RLa3z0F
http://tp2.sinaimg.cn/1898112181/50/40026011245/1 程龚_NJU 网页链接 2015-07-25 17:22
自然语言处理 谢谢
只给@王威廉 三个小时介绍信息抽取实在是太遗憾了
王威廉 网页链接 转发于2015-07-25 22:01
谢谢老师们和同学们来听课。其实信息抽取在CMU是一门课,我们会用一学期的时间来讲,所以3小时的讲座是浓缩版本。回头我会争取在明早把幻灯片放到网上。之后录像出来了也会把链接告诉大家。
http://tp4.sinaimg.cn/1403077963/50/1298701667/1 黎铭-NJU 网页链接 2015-07-25 15:11
教育网站
今年我们将在软件工程重要国际会议ASE-2015上组织第三届软件挖掘workshop,SoftwareMining-2015,主要关注如何对各种软件数据进行有效挖掘,及软件挖掘任务给挖掘技术自身带来的挑战。欢迎大家投稿!详见http://t.cn/RLa0KIo
好东西传送门 网页链接 转发于2015-07-25 15:39
>> @黎铭-NJU: 请各位朋友帮忙转发一下。谢谢!@数据挖掘研究院 @数据挖掘与数据分析 @社会网络与数据挖掘 @中国计算机学会软件工程专委会
http://tp3.sinaimg.cn/2288385870/50/5607746678/1 赵家平USC 网页链接 2015-07-25 13:01
深度学习 资源 PDF
其次CNN的顶层的softmax概率并没有给出 Object uncertainty (variance), 因此当我们feed an object with a new label到CNN后,人是可以知道它是第1001类的,而cnn不知道。Zoubin组给出了怎样得到deep nets中label uncertainty (通过variational inference in Gaussian process) http://t.cn/RLbKXml
路遥_机器学习 网页链接 转发于2015-07-25 19:05回复 @unluckyAllen “有实际需求场景啊”
我们的工作也是想解决这个问题 http://t.cn/R2a8P0d 用在一千类的ImageNet上训练好的CNN,给两万类的ImageNet分类。我们的想法很简单,理论深度不能和这篇文章相提并论,但scalability很好,也很管用。
http://tp3.sinaimg.cn/2288385870/50/5607746678/1 赵家平USC 网页链接 2015-07-25 12:56
视觉 Leon Bottou 统计
Computer vision is not a statistical problem (Léon Bottou), 很赞同:首先, 各个dataset都有bias, 在一个dataset上的 training samples 都只是来自population的少量的样本, 而我们知道 sample distribution != popular distribution,所以training得到的model,一般都不能extropolate (generalize);
http://ww1.sinaimg.cn/large/8865ff4egw1euexjbvsbdj214q0mwguv.jpg
孙明明_SmarterChina 网页链接 转发于2015-07-25 23:45回复 @林倞 “这么说的话 绝大部分的实践学科都...”
这个是想掀统计学习的桌子。但是实际上等于没说。你样本少,有bias,去获取海量无bias样本好了么。虚拟世界,给人带上摄像机和传感器,各种方法都能获得大量的数据。除非他证明CV是依赖量子随机和人的自由意志,才能说无法统计学习。但这显然不可能
http://tp1.sinaimg.cn/1871306500/50/40054367536/1 Bishop_Gorov 网页链接 2015-07-25 12:26
资源 黄亮 课程
#ACL2015# Tutorial推荐一下t2和t6(尤其是去年没参会的)。主讲人中杰森和黄亮是nlp领域犹太人和华人的顶峰不需多说,这里主要为我的朋友matt做一下广告。matt编程和研究都是最近clsp学生的第一把交椅,讲解东西更是极为透彻,已经被选中在明年扛起cmu的ml课主讲的大旗。求扩散 @算文解字 @iB37 @52nlp
算文解字 网页链接 转发于2015-07-25 17:39
正好去年这俩都去了,的确不错,推荐!
http://tp1.sinaimg.cn/1557337604/50/5731260183/1 吴甘沙 网页链接 2015-07-25 11:55
深度学习 GPU
Xeon Phi下一代Knights Landing的新技术细节 http://t.cn/RLaiAKg 。开源项目Xeon-CafPhi http://t.cn/RLaiAKe把Caffe跑在Phi上,还只是刚开始。前面也介绍过Intel的IDLF http://t.cn/R2eqMn5 。还会有更猛的出来,也许不久Caffe源代码加入针对CPU和Phi优化的实现,性能不亚于、甚至优于最好的GPU
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-07-25 07:29
资源 Ryan Baker 视频 特征工程
【视频:特征工程】《Big Data: Week 3 Video 3 - Feature Engineering》by Ryan Baker http://t.cn/RLaLBsp云:http://t.cn/RLaLBsO
http://ww1.sinaimg.cn/large/5396ee05jw1eueo27s682j20no0ai407.jpg
http://tp4.sinaimg.cn/1891996243/50/40067152771/1 CodingCat 网页链接 2015-07-25 07:27
架构 资源 Spark 课程
当发现scalable machine learning只有5周时。。。这门课到最后还是让我失望了。。。蜻蜓点水。。。。我以为最后会深入一下mllib的原理。。。。。。。。。其实更多的是spark mllib tutorial加一些基础知识。。。。。
时蝇喜箭 网页链接 转发于2015-07-25 10:43回复 @好东西传送门
伯克利CS190级的入门课么,这里有Advanced Apache Spark Workshop的视频/练习等等 http://t.cn/RAl18wC
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-07-25 06:32
深度学习 应用 语音 自然语言处理 社交网络 主题模型
第40期NLP日报(2015-07-24) 1) 论文: Social-Relational Topic Model for Social Networks 2) 第五届语义技术大会论文征稿 3) 论文: 基于Attention-based RNN的连续语音识别 完整版11条 http://t.cn/RLaAFjn
http://ww2.sinaimg.cn/large/005HjjGQgw1euemf42cr1j30d709n0t8.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-07-25 06:31
深度学习 视觉 行业动态
第121期计算机视觉日报(2015-07-24) 1) 百度将开放其人脸识别API 2) 上科大将成立Visual Computing组 3) 深度学习及其机器视觉应用 完整版7条 http://t.cn/RLaAkb8
http://ww2.sinaimg.cn/large/005HjjGQgw1euemeacsyej30p00dw41j.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-07-25 06:29
深度学习 视觉 算法 行业动态 简报 神经网络
第309期机器学习日报(2015-07-24)http://t.cn/RLaAdJn 1) Facebook遭遇的两大机器学习难点 2) 高效并行自组织映射(SOM)库Somoclu 3) 百度人脸识别API 4) 第五届语义技术大会(JIST2015) 5) 卷积神经网络建模用户行为 完整版28条 http://t.cn/RLaAdJE
http://ww3.sinaimg.cn/large/005HjjGQgw1euembzp0boj311c18604qx.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-07-25 05:41
自然语言处理 代码 机器翻译
【开源实现:面向机器翻译的Attention-based编/解码器】"Attention-based encoder-decoder model for machine translation" http://t.cn/RLawjsi
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-07-25 05:25
经验总结 应用 资源 Kaggle Phil Roth Python 安全 博客 幻灯片
【基于Python的(Kaggle)恶意软件检测】《Examining Malware with Python》by Phil Roth http://t.cn/RLawtFiSlide:http://t.cn/RLawtFM 云:http://t.cn/RLawtFx
http://ww3.sinaimg.cn/large/5396ee05jw1euekexyh4jj20od0bajw2.jpg
页:
[1]