解应春BW 发表于 2015-10-16 13:31:43

机器学习日报 2015-10-15 ICDM15最佳学生论文;深度CNN行人检测;Github 的清点对象算法

机器学习日报 2015-10-15

[*]NLP是否需要树结构的讨论 @车万翔
[*]ICDM15最佳学生论文 @iB37
[*]在NLTK里使用斯坦福中文分词器的尝试 @52nlp
[*]Github 的清点对象算法 @微博商业技术
[*]深度CNN行人检测 @爱可可-爱生活

@好东西传送门 出品, 过往目录 见http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报   或点击点我订阅


本期话题有:全部26 深度学习10 算法7 自然语言处理6 经验总结6 视觉5 资源5 会议活动4 应用2
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)


http://tp2.sinaimg.cn/1829948001/50/40004547454/1 车万翔   网页版 2015-10-15 10:38
深度学习 自然语言处理
句法分析一直是自然语言处理的核心任务之一,然而在深度学习浪潮之下,是否可以直接进行端到端的学习,而不在需要树结构特征了呢?本文总结了近年来的相关的一些研究进展,试图回答这一问题。 http://t.cn/Ry1Dpzs




winsty 网页版 转发于2015-10-15 12:23回复 @刘知远THU “NLP四大型男出手了。[微笑]”
把问题的domain knowledge放到model里 一定是有意义的


Copper_PKU 网页版 转发于2015-10-15 12:54回复 @AixinSG
没domain Knowledge,句法往上就很ugly了,一直关注用CCG做parsing的工作


王威廉 网页版 转发于2015-10-15 13:27
继Li et al. (ACL 2015)之后关于NLP是否需要树结构的进一步讨论。





http://tp1.sinaimg.cn/2536116592/50/5716095299/0 iB37   网页版 2015-10-15 21:32
会议活动 Fei Wang ICDM 行业动态 会议 论文 姚期智
#ICDM15最佳学生论文#ICDM15本地主席Fei WANG(11年全国优博)和清华Linyun YU(12级直博,本科导师姚期智,http://t.cn/RyBWVxi )等<Uncovering and Predicting Information Cascading Process with Behavioral Dynamics>微观行为动力机制–>宏观级联过程.腾讯微博:时间轴上的转发数http://t.cn/RyBWVxJ
http://ww2.sinaimg.cn/large/972a1170jw1ex24nkdfdsj213i0c47c0.jpg







http://tp2.sinaimg.cn/2104931705/50/5599477433/1 52nlp   网页版 2015-10-15 21:00
自然语言处理 Java Python
NLTK是知名的Python自然语言处理工具包,而斯坦福大学提供了一系列Java NLP工具,包括一系列中文处理工具,本文是在NLTK里使用斯坦福中文分词器的一个尝试 http://t.cn/RyBp3qS







http://tp3.sinaimg.cn/5536610446/50/5720431734/1 微博商业技术   网页版 2015-10-15 11:00
经验总结 算法 博客
#技术分享# 【Github 的清点对象算法(转)】Github攻城狮想出妙计解决clone前的长时等待问题,通过Bitmap索引加速操作,同时还对索引压缩节约磁盘空间,时空两个维度都作出了客观的优化。原文链接:http://t.cn/Ryp5ryk 如果还不够味,不妨再看看这里:http://t.cn/Ry1eXYl
http://ww4.sinaimg.cn/large/0062H3iujw1ex1lucbkw3j30ii4tpqv5.jpg







http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活   网页版 2015-10-15 06:32
深度学习 视觉 算法 Denis Tome Federico Monti Marco Tagliasacchi 论文 神经网络
【深度CNN行人检测】《Deep convolutional neural networks for pedestrian detection》Denis Tomè, Federico Monti, Luca Baroffio, Luca Bondi, Marco Tagliasacchi, Stefano Tubaro (2015) http://t.cn/Ry18nvJ
http://ww1.sinaimg.cn/large/5396ee05gw1ex1f8h9erxj20em052wf7.jpg







最新动态
2015-10-15 (21)


http://tp2.sinaimg.cn/1785748853/50/40004237873/1 星空下的巫师   网页版 2015-10-15 21:44
深度学习
Spoken language identification with deep convolutional networks · YerevaNNhttp://t.cn/RynDHPo







http://tp1.sinaimg.cn/2536116592/50/5716095299/0 iB37   网页版 2015-10-15 20:36
会议活动 深度学习 资源 自然语言处理 ICDM 会议 教育网站 课程 数据科学
#ICDM15论文调度# 14号ws和博士论坛,三个panel:如何写论文,PhD生存之道,后PhD生活. 15、16和17主会,三天均有tutorial;15上午竞赛环节,16下午是游览.有三个keynote:诺奖得主,机器学习领袖,工业界数据科学家. session主题:深度学习,推荐,社会网络,图挖掘,文本挖掘,在线/增量学习http://t.cn/RyBN5t5
http://ww4.sinaimg.cn/large/972a1170jw1ex23lu92uuj213q0f2wh6.jpg







http://tp4.sinaimg.cn/1890969215/50/5610283835/1 李正华NLP   网页版 2015-10-15 20:14
资源 自然语言处理 教育网站 课程
今天上中文信息处理课,用1个多小时的时间,给同学们推导了bigram语言模型中最大似然估计的由来,用到了拉格朗日乘数法,课后让同学帮忙照相,留住幸福的一刻。两年多的教学过程中,我自己的收获很多。欢迎关注课程主页http://t.cn/RyB9mpK;欢迎就教学方面交流指导
http://ww3.sinaimg.cn/large/70b5e67fgw1ex22xxfkh3j21kw16oqcp.jpg







http://tp3.sinaimg.cn/3411134394/50/40072311746/0 出门问问   网页版 2015-10-15 19:38
会议活动 应用 自然语言处理 行业动态 会议 机器人 李志飞 问答系统
【第二届网易未来科技峰会 | @李志飞AI 演讲】在智能硬件论坛环节,出门问问 CEO李志飞分享了关于机器人现状和发展的一些看法,指出中国很多方面超越了美国的同行。他同时分享Ticwatch的创业过程,指出智能硬件产品本身不能太同质化,专精于某些有需求的领域才是良好的发展方向。http://t.cn/RyBopWw







http://tp3.sinaimg.cn/2316531634/50/40029784010/1 立委_米拉   网页版 2015-10-15 19:22
经验总结 博客
科学网—世人皆错nlp不错,民调错大数据也不会错 http://t.cn/RyBSlj0
http://ww1.sinaimg.cn/large/8a1377b2jw1ex21i4zem4j20m809bjs6.jpg







http://tp4.sinaimg.cn/2739745035/50/5715330918/1 AlphaBet__Inc   网页版 2015-10-15 19:19
经验总结 博客
发表了一篇转载博文《[转载]反向传播BP模型》http://t.cn/RyBSaxh







http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活   网页版 2015-10-15 18:49
经验总结 深度学习 博客
【靠深度学习展露头脚的五大创业公司】《5 Startups Playing Big, and Betting on the Future, with Deep Learning》By Isha Salian Real Life Analytics/ZZ Photo/MicroBlink/HyperVerge/ViSenze http://t.cn/RyBXftW
http://ww1.sinaimg.cn/large/5396ee05gw1ex20j5w884j208c069js1.jpg







http://tp4.sinaimg.cn/5388254711/50/5715589803/1 bigdata-research   网页版 2015-10-15 16:52
算法 KNN 聚类 决策树
决策树分类算法决策树归纳是经典的分类算法。它采用自顶向下递归的各个击破方式构造决策树。树的每一个结点上使用信息增益度量选择测试属性。可以从生成的决策树中提取规则.KNN法(K-NearestNeighbor):KNN法… http://t.cn/RyBf7CV







http://tp2.sinaimg.cn/1985499101/50/22841137257/1 晓如微博   网页版 2015-10-15 16:20
经验总结 应用 博客 教育网站 可视化 社交网络
#北大可视分析博客# 对于稀疏采样的带有地理标签的社交媒体数据的交互式可视分析与探索 – Interactive Visual Discovering of Movement Patterns from Sparsely Sampled Geo-tagged Social Media Data | PKU Visualization Blog http://t.cn/RyBts10
http://ww4.sinaimg.cn/large/76584fddjw1ex1w8odbxyj20kt0aigpo.jpg







http://tp4.sinaimg.cn/1645536727/50/5654328915/1 互动出版网china-pub   网页版 2015-10-15 16:08
经验总结 算法 资源 博客 书籍
#新书预售# 《编程之法:面试和算法心得》预售地址:http://t.cn/RyBtcu5 CSDN访问量过千万的博客“结构之法 算法之道”博主July著作;内容涉及面试、算法、机器学习三大主题;作者数年的积累成果;进入IT行业求职笔试和面试必备。@研究者July
http://ww2.sinaimg.cn/large/6214e5d7jw1ex1vvvpk4bj20c40fa3yn.jpg




研究者July 网页版 转发于2015-10-15 20:36
互动出版网开始预售,下面那个链接里有比较详细的目录。so,目前异步社区正在火热销售中:http://t.cn/RyEHWcp,互动预售,下周上架京东等店





http://tp2.sinaimg.cn/3968170429/50/40071778142/1 Datartisan   网页版 2015-10-15 13:45
自然语言处理
词嵌套(词向量)简史 http://t.cn/RyB2CbC @好东西传送门 @爱可可-爱生活 @西瓜大丸子汤 @数据挖掘研究院 @数据挖掘与数据分析







http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算   网页版 2015-10-15 11:48
深度学习 视觉 产业 官赵勇 智能汽车
在云栖大会15日主题演讲中,格灵深瞳联合创始人兼首席技术官赵勇指出,在过去几年, 传感器的进步给计算机视觉带了非常大的发展空间,然而计算机视觉技术的研究则可以带来更多成本的削弱。就拿自动驾驶的实现,结合深度学习,计算机视觉技术可以取代昂贵的传感器,同时也可以便捷地采集地理位置信息。
http://ww3.sinaimg.cn/large/67c63eb8gw1ex1odc525uj20bo07swf0.jpg







http://tp1.sinaimg.cn/3769368692/50/5730530271/1 格灵深瞳   网页版 2015-10-15 11:33
视觉
【机器视觉技术成我国未来发展新星】http://t.cn/RyBvwm1 机器视觉系统的出现来自繁琐劳动力的替代需求。机器视觉自动化设备可以不知疲倦的进行重复性的工作,且在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,机器视觉可替代人工视觉。
http://ww3.sinaimg.cn/large/e0ac0074gw1ex1nxisnrxj20ru0b8q5d.jpg







http://tp1.sinaimg.cn/1704141184/50/40015959463/1 张包峰   网页版 2015-10-15 11:24
算法 KNN 聚类
#Apache MRQL# http://t.cn/RLNaguT 比较有意思的一层SQL-like DSL。一直觉得SQL缺乏在于没法表达迭代计算及更复杂的算法,而MRQL让我看到这一步的原型,下图是它做k-means和矩阵计算的示例,具体可以接到比如BSP执行引擎上run。
http://ww1.sinaimg.cn/large/65932180gw1ex1nohbuy1j215q0uy7ao.jpg







http://tp3.sinaimg.cn/2475016390/50/40061918789/1 3A狗狗   网页版 2015-10-15 11:12
深度学习 资源 Geoffrey Hinton Royal Society 视频
Prof. Geoffrey Hinton’s talk on “Deep Learning” at Royal Society, London ,http://t.cn/Ry1B5wy [需梯] via twitter@deeplearning4j twitter@deeplearninghub







http://tp2.sinaimg.cn/2295615873/50/5709954620/1 英特尔商用频道   网页版 2015-10-15 11:00
深度学习 GPU
#英特尔商用中心# 【英特尔发威深度学习,GPU神话不再】深度学习对高并行度、浮点计算的能力要求很高,英特尔今年重点优化了Xeon和Xeon Phi处理器,应用于伯克利最流行的深度学习框架Caffe,大幅提升处理速度,打破GPU在训练上遥遥领先的神话。http://t.cn/Rym2cST
http://ww3.sinaimg.cn/large/88d45181jw1ex153syb8xj21hc0u014x.jpg







http://tp4.sinaimg.cn/1645536727/50/5654328915/1 互动出版网china-pub   网页版 2015-10-15 10:00
资源 书籍
#首发推荐# 《大数据挖掘与机器学习:工业4.0时代重塑商业价值》(china-pub首发) 购买地址http://t.cn/Ry1gyNg 大数据时代,甄别信号与噪声的科学与艺术。没有复杂深奥的数学推导,一本技术、管理、经营、营销人员都可以看懂的数据挖掘和机器学习书@人民邮电出版社
http://ww3.sinaimg.cn/large/6214e5d7jw1ex1l8w0q26j20g30mfdmr.jpg







http://tp3.sinaimg.cn/5648620342/50/5731472374/1 闫安Jon   网页版 2015-10-15 09:58
论文
Improving Back-Propagation by Adding an Adversarial Gradienthttp://t.cn/Ry1gZvn 把普通的分类误差反向传播到输入节点,沿着在输入节点梯度的方向扰动样本,重新计算输出再反传一次,就得到对抗梯度。用其更新权重,可增强网络分类对抗样本时的抵抗力,并提高整体表现。
http://ww1.sinaimg.cn/large/006ah2bIjw1ex1l4przrsj30gb04kjrp.jpg







http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活   网页版 2015-10-15 08:33
Python 代码 统计
【开源(Python):基于XGBoost/Scikit-Learn的贝叶斯优化BayesBoost】”Bayesian Optimization using xgboost and sklearn API” GitHub:http://t.cn/Ry135W1BayesianOptimization:http://t.cn/Ry135W3







http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门   网页版 2015-10-15 06:50
深度学习 视觉 算法 行业动态 神经网络
第203期计算机视觉日报(2015-10-14) 1) 用谷歌FaceNet深度神经网络进行面部识别的开源项目: OpenFace 2) CNN深度人脸识别 3) 面向视觉焦点预测的全卷积神经网络DeepFix 完整版6条http://t.cn/Ry1RiPQ
http://ww4.sinaimg.cn/large/005HjjGQgw1ex1frbryhjj30dx04a0tx.jpg







http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门   网页版 2015-10-15 06:44
会议活动 深度学习 视觉 算法 CIKM 会议 简报
第391期机器学习日报(2015-10-14)http://t.cn/Ry1R4Gp 1) CIKM Competition数据挖掘竞赛夺冠算法总结 2) RNN模型横向比较 3) CNN深度人脸识别 4) 基于Text-Attentional CNN的场景文字检测 5) 用RNN自动生成标题 完整版25条 http://t.cn/Ry1R4GN
http://ww4.sinaimg.cn/large/005HjjGQgw1ex1flhawpgj30dx04a0tx.jpg









页: [1]
查看完整版本: 机器学习日报 2015-10-15 ICDM15最佳学生论文;深度CNN行人检测;Github 的清点对象算法