机器学习日报 2015-07-26 知识图谱;中国人工智能大会CAAI;王威廉信息抽取讲座;统计学习
机器学习日报 2015-07-26[*]知识图谱——机器大脑中的知识库 @刘知远THU
[*]正则引擎性能测试 @agentzh
[*]中国人工智能大会CAAI @中国人工智能学会CAAI
[*]王威廉信息抽取讲座 @王威廉
[*]统计学习里的挠头术语 @智博是小叮当
@好东西传送门 出品, 过往目录 见http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报 或点击点我订阅
本期话题有:全部34 自然语言处理11 深度学习10 资源7 算法5 视觉4 会议活动4 应用3知识工程3 架构1
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp4.sinaimg.cn/1464484735/50/40073446687/1 刘知远THU 网页版 2015-07-26 21:20
知识工程 资源 书籍 知识库
最近写了一篇关于知识图谱的科普短文《知识图谱——机器大脑中的知识库》,未来可能会成为一本书中的一章,先放出来敬请大家指正:http://t.cn/RLSkl8l [微笑]
http://tp1.sinaimg.cn/1834459124/50/40012328877/1 agentzh 网页版 2015-07-26 12:21
正则表达式
用一点 Perl 搞了个简单的网页生成器,汇总了我的正则引擎性能测试集的最新测试结果,涵盖了 PCRE 解释器与 JIT 编译器、PCRE2 解释器和 JIT 编译器、Google 的 RE2 以及我的 SRegex DFA 原型 re.pl:http://t.cn/RLSSk0H 这个网页会经常更新,同时会添加越来越多的用例。希望我的 sregex 越来越快。
陈晓鸣在硅谷 网页版 转发于2015-07-26 14:52回复 @RednaxelaFX “Repost”
真的好希望有人能给CPython做一个JIT。别跟我说有PyPy,习惯的力量太强大了,推动人们不使用默认实现实在太难。
http://tp3.sinaimg.cn/2280366510/50/5694308178/1 中国人工智能学会CAAI 网页版 2015-07-26 11:14
中国人工智能大会-谭铁牛院士报告详细内容… http://t.cn/RLS6qrc http://t.cn/z8ip11h
http://tp4.sinaimg.cn/1657470871/50/5676743531/1 王威廉 网页版 2015-07-26 08:28
资源 自然语言处理 幻灯片 教育网站
我在北大的CIPS暑期学校信息抽取讲座主要讲了三部分:基本的命名实体抽取方法和实践、关系抽取一些较新的进展、以及最新推断和抽取的联合模型。 幻灯片已经放到CMU主页上,可以下载了:http://t.cn/anTZzK
http://tp1.sinaimg.cn/1646120672/50/5672464174/1 智博是小叮当 网页版 2012-02-19 20:12
Yi Wang 统计
推荐文章 Bayes 和 Bayesian:统计学习里的挠头术语。作者是大名鼎鼎的Yi Wang,文章介绍了Bayes,Bayes推断,Bayes网络,Bayes模型之间的关系,看完之后有茅塞顿开的感觉。http://t.cn/zOLuETY
最新动态
2015-07-26 (28)
http://tp3.sinaimg.cn/1455173150/50/40066140661/1 Vinjn张静 网页版 2015-07-26 23:00
视觉
我在 @知乎 回答了【opencv和pcl的区别?】:我有一套方法论来分析相似的东西:比较它们多输入和输出。 OpenCV 输入的是图片,Basic Structures 输出的有时候是图片,…http://t.cn/RLo7zNQ
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页版 2015-07-26 21:00
会议活动 算法 资源 Eric P. Xing IJCAI PDF Qirong Ho 会议 课程
T29: A new look at the system, algorithm, and theory foundations of scalable machine learning. – Eric P. Xing and Qirong Ho, ijcai-15 tutorial. http://t.cn/RLSDOM6
http://tp3.sinaimg.cn/1914450674/50/5644229416/1 孙明明_SmarterChina 网页版 2015-07-26 20:19
公告板 自然语言处理 问题
NLP的众包反馈怎样做才好呢?每天看到NELL在twitter上发 True of False,然而并没有什么用户反应。或许他只是通知大家说,我学到了。但是如果真有用户告诉它是否是对的,该有多好。
http://tp1.sinaimg.cn/1240281152/50/5609223605/1 路遥_机器学习 网页版 2015-07-26 18:06
深度学习 算法
看好概率图模型PGM的未来:1)目前深度学习效果好,靠的大量标注样本。要利用好无标注样本学特征,个人觉得用PGM建生成模型最靠谱。2)PGM现在也融入深度学习,来拟合几个概率分布函数,缓解PGM学习和推断的困难,具体参考DeepMind和Kingma&Welling的文章。人想登月不能靠爬树,得造火箭,虽然很艰难。
http://ww3.sinaimg.cn/large/49ed3040gw1eugc2o3bwxj219n0zddvu.jpg
LR机器学习计算机视觉 网页版 转发于2015-07-26 19:32回复 @KevinQuant “转发微博”
感觉人的大脑在做决策的时候就是类似于PGM的模式;专家的大脑就是一个训练的很好的PGM
http://tp2.sinaimg.cn/1898112181/50/40026011245/1 程龚_NJU 网页版 2015-07-26 17:50
会议活动 自然语言处理 会议 矩阵
混进ACL听了一下午的matrix和tensor decomposition,总算是对这套工具建立起了系统性的认识。原理很直接,听了以后容易服理,而且工程性也好,值得一用。 http://t.cn/zTTEk2Q
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 17:34
应用 自然语言处理 机器人 杨洋
#CCAI2015# 京东数据与机器智能部负责人杨洋分享了智能聊天机器人JIMI的技术实现。比如NLP体系,自然语言处理NLP,具体是意图识别,命名实体识别,应答引擎;机器学习,分为有监督、半监督和无监督学习,基于用户反馈的学习,评测体系和异构信息融合与挖掘;基于用户画像的咨询服务等。
http://ww1.sinaimg.cn/large/67c63eb8gw1eugb6guajbj20bo07sjs7.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 17:25
深度学习 语音 自然语言处理 俞凯
#CCAI2015# 苏州思必驰联合创始人、首席科学家俞凯表示:人机交互的历史变迁,是组织材料到网络交互再到搜索刺激自然语言发展,多模态处理,是文本交换向处理任务变迁。传统人机语音交互,从语音识别到语义解析,再到深度学习。而新人机交互,要偏重认知智能,静态认知、动态认知、进化认知等。
http://ww1.sinaimg.cn/large/67c63eb8gw1eugax24hnzj20bo07sq47.jpg
http://tp3.sinaimg.cn/2280366510/50/5694308178/1 中国人工智能学会CAAI 网页版 2015-07-26 16:17
胡德文 蒋田仔 李远清 孙富春 俞凯
2015中国人工智能大会之开放式讨论2:人工智能与认知科学。国防科大胡德文教授主持,中科院自动化蒋田仔研究员、重邮王国胤教授、华南理工大学李远清教授、清华大学孙富春教授、苏州思必驰联合创始人俞凯、北师姚力教授,针对类闹智能、混合智能及应用前景进行热烈的博弈对话… http://t.cn/z8ip11h
http://ww3.sinaimg.cn/large/87eba1aejw1eug8msqznaj20np0hsjto.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 16:06
胡德文 神经科学
#CCAI2015# “人工智能与认知科学”分论坛在国防科学技术大学教授胡德文的主持下正式开始。他分享了两个大型规划:“视听觉信息的认知计算”和“中国脑计划”。后者总体思路从2015-2030年,研究目标是认识脑、模拟脑、开发脑和保护脑。讨论聚焦在三方面:类脑智能、混合智能、应用前景。
http://ww3.sinaimg.cn/large/67c63eb8gw1eug8n72p26j20bo07sdh7.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 15:06
深度学习 应用 知识工程 自然语言处理 刘丹 知识库
#CCAI2015# 京东智能通讯部总监刘丹分享了三方面实践:京东在线智能客服机器人,满意度评价比人工满意度还高;封闭式环境等特定场景可以量化评估;知识图谱分析,包含标签输入、DNN推理,得到更深层次的关系,达到精准营销的效果,京东618大促下,是人工(简单打标签)的2.3倍。http://t.cn/RL6CTJ3
http://ww1.sinaimg.cn/large/67c63eb8gw1eug6w68wj3j20bo07sgme.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 15:02
知识工程 知识库
#CCAI2015#北京交通大学计算机科学系主任于剑谈到知识是什么?他认为知识表示有框架结构和语义等,但到学习阶段时,无法实现自动化。对于知识图谱,首先应该弄清楚什么是知识,什么是学习,这里很多概念是没法明晰定义,所以识别概念是人工智能重要能力,人工智能关键是理论的进展,而不是技术的进步。
http://ww3.sinaimg.cn/large/67c63eb8gw1eug6s4dcevj20bo07swfa.jpg
http://tp4.sinaimg.cn/2124455871/50/5719817991/1 无聊的面条 网页版 2015-07-26 14:25
深度学习
我在 @知乎 回答了【深度学习caffe的代码怎么读?】:mark http://t.cn/RLSOzkl
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 14:24
自然语言处理 周明
#CCAI2015# 微软研究院首席研究员、自然语言计算组经理周明表示:需求驱动、大数据推动系统水平提升、计算能力(云计算)、用户自然进入了Loop,人机有了更好的配合等,成为人工智能新的发展机遇。未来从应用驱动角度,是人工智能+,根据需求做有用的技术并调整;和设备、场景结合;考虑人的因素。
http://ww4.sinaimg.cn/large/67c63eb8gw1eug5of3yalj20bo07saal.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 14:21
深度学习 视觉 算法 自然语言处理 神经网络 宗成庆
#CCAI2015# 中科院自动化所研究员宗成庆深入分享了人工智能技术内容,现在机器学习发展方向,深度学习(DL)方法与人工神经网络(ANN)方法的区分,以及自然语言理解,图像、视频分析,智能系统和关于跟踪和坚守等方面的思考。
http://ww2.sinaimg.cn/large/67c63eb8gw1eug5lh7rpdj20bo07smyr.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 14:08
查红彬
#CCAI 2015# 在下午的“机器学习与模式识别”论坛上,北京大学智能科学系教授、机器感知与智能教育部重点实验室主任查红彬表示获得预测能力的基本途径是学习,学习是人工智能研究的核心内容,对于机器感知研究的重要性,他认为只有机器感知才能人机环境互动,进而才能自主学习,从而达到智能演化。
http://ww2.sinaimg.cn/large/67c63eb8gw1eug58pajjgj20bo07sgmj.jpg
http://tp3.sinaimg.cn/2280366510/50/5694308178/1 中国人工智能学会CAAI 网页版 2015-07-26 13:56
查红彬 李航 刘成林 刘丹齐 周明
开放式讨论:机器学习与模式识别。中科院自动化所宗成庆主持,华为李航、中科院自动化所刘成林、北交大于剑、北大查红彬、微软周明、京东刘丹齐聚舞台,围绕7个“关于”各抒己见,舌战群雄中…. http://t.cn/z8ip11h
http://ww2.sinaimg.cn/large/87eba1aejw1eug4p5c6j6j20np0hs40f.jpg
http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页版 2015-07-26 13:41
宗成庆
#CCAI2015# 2015中国人工智能大会(CCAI 2015)进入下午分论坛环节。今日将特邀多位专家分别讨论“机器学习与模式识别”和“大数据的机遇与挑战”。其中,“机器学习与模式识别”分论坛在中科院自动化所研究员宗成庆主持下正式开始。
http://ww1.sinaimg.cn/large/67c63eb8gw1eug4dfhlefj20bo07smyr.jpg
http://tp1.sinaimg.cn/1834459124/50/40012328877/1 agentzh 网页版 2015-07-26 11:39
算法
主要的缺憾和局限是:1. 对 NFA 仿真算法很差的绝对效率有些故意回避,而倾向于拿对于回溯算法不利的病态例子来进行性能比较。2. 对通过 DFA cache 对 NFA 仿真算法的优化效果讨论不足,其实 RE2 表现好的情形主要都靠 DFA,其真正的 NFA 实现慢得像爬。3. DFA 方法没有扩展到一般的子匹配捕获的情形。
http://tp2.sinaimg.cn/2151877461/50/5727951723/1 数据娃掘-刘壮 网页版 2015-07-26 11:35
深度学习 自然语言处理 情感分析
从深度学习的词向量中最大的获益是什么?有能力对单词进行精确的分类 国家类的单词可以聚和到一起–>因此可以通过词向量将地名类的单词区分出来 可以在其他的任务中将单词的任意信息融合进来 可以将情感分析(Sentiment)问题映射到单词分类中:在语料库中寻找最具代表性的正/负例单词[威武]#机器学习#
http://tp4.sinaimg.cn/2132448623/50/5732453707/1 户保田 网页版 2015-07-26 09:57
Jason Eisner
Jason Eisner :structured belief propagation for nlp @Acl2015 http://t.cn/zTTEk2Q
http://ww1.sinaimg.cn/large/7f1a956fjw1eufxwkaa4yj20u00u0n15.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页版 2015-07-26 08:09
资源 自然语言处理 机器翻译 课程
第41期NLP日报(2015-07-25) 1) 中英语料分享 2) ACL2015 Tutorial推荐 3) 面向机器翻译的Attention-based编/解码器 完整版9条 http://t.cn/RLS520u
http://ww2.sinaimg.cn/large/005HjjGQgw1eufuuy9slnj30qw0eegpr.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页版 2015-07-26 08:08
深度学习 视觉
第122期计算机视觉日报(2015-07-25) 1) Facebook用CNN生成图片的代码 2) 计算机视觉不是一个统计问题? 3) 人脸检测和识别的Web服务API汇总 完整版8条 http://t.cn/RLS5Z3i
http://ww2.sinaimg.cn/large/005HjjGQgw1eufutqr8hnj314q0mwjwy.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页版 2015-07-26 08:05
会议活动 深度学习 视觉 算法 ICML 会议 简报
第310期机器学习日报(2015-07-25)http://t.cn/RLSqDIe 1) RNN以及LSTM的介绍和公式梳理 2) ICML 2015压轴讨论总结:6大神畅谈深度学习的未来 3) 人脸检测和识别的Web服务API汇 4) ZS压缩的Google Books Ngram数据集 5) 概率图模型(PGM)有必要系统的学习一下么? 完整版21条 http://t.cn/RLSqDIk
http://ww4.sinaimg.cn/large/005HjjGQgw1eufuq9aa44j31180iy76d.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-07-26 07:11
资源 PDF 教育网站 矩阵
【论文:分布式矩阵补全与(鲁棒)分解】《Distributed Matrix Completion and Robust Factorization》L. Mackey, A. Talwalkar, M. I. Jordan (JMLR2015) http://t.cn/RLSbB1EDFC&Code:http://t.cn/RLSbB18
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-07-26 07:06
架构 应用 资源 PDF Spark 教育网站 信息检索
【论文:面向大规模机器学习的自动模型搜索TUPAQ】《Automating Model Search for Large Scale Machine Learning》E. Sparks, A. Talwalkar, D. Haas, M. Franklin, M. I. Jordan, T. Kraska (SOCC2015) pdf:http://t.cn/RLSbHdn
爱可可-爱生活 网页版 转发于2015-07-26 07:13
arXiv上的版本《TuPAQ: An Efficient Planner for Large-scale Predictive Analytic Queries》http://t.cn/RLSbDQN
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-07-26 06:59
论文
【论文:基于sketching实现快速可靠的张量分解】《Fast and Guaranteed Tensor Decomposition via Sketching》Y Wang, H Tung, A Smola, A Anandkumar (2015)http://t.cn/R2EiI3c
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-07-26 06:34
深度学习 自然语言处理 代码
【开源:基于Torch的RNN文本生成】”Playground for some RNN stuff in Torch” GitHub:http://t.cn/RLS43GZ
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页版 2015-07-26 02:54
会议活动 资源 Bing Liu IJCAI Zhiyuan Chen 会议 教育网站 课程
Lifelong Machine Learning in the Big Data Era – Tutorial at IJCAI 2015, Zhiyuan Chen and Bing Liu. http://t.cn/RLSAQFa
页:
[1]