机器学习日报 2016-06-02 深度学习与自然语言处理(斯坦福cs224d) ;如何把数据变成产品?
机器学习日报 2016-06-02[*]优质语料:联合国平行语料1.0版,包括阿英西法俄中六种语言,共15个语言对,每种1500W以上 @陈博兴-NLP
[*]深度学习与自然语言处理(斯坦福cs224d) @爱可可-爱生活
[*]讨论:机器学习专家与统计学家观点上有哪些不同? @老师木
[*]什么是数据科学?如何把数据变成产品? @电商行业
[*]#ACL16#神经机器翻译(neural MT)长文8篇+短文3篇 @学生古
@好东西传送门 出品, 过往目录 见http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报 或点击点我订阅
本期话题有:全部20 深度学习8 自然语言处理5 算法5 视觉4 经验总结4 会议活动3 资源3架构1 公告板1
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tva1.sinaimg.cn/crop.0.0.180.180.50/6960c3f4jw1e8qgp5bmzyj2050050aa8.jpg 陈博兴-NLP 网页版 2016-06-02 22:20
资源 自然语言处理 PDF 数据
联合国平行语料1.0版发布,包括阿英西法俄中六种语言,总共15个语言对,语料包含了1990-2014年的数据,规模都在1500万个句对以上。 下载 网址: http://t.cn/R5bHcqg 论文:http://t.cn/R5bHcqe @好东西传送门
http://ww2.sinaimg.cn/large/6960c3f4gw1f4h8of69x9j20nn0h7te3.jpg
http://tva2.sinaimg.cn/crop.10.34.646.646.50/5396ee05jw1ena6co8qiwj20sg0izjxd.jpg 爱可可-爱生活 网页版 2016-06-02 20:27
经验总结 深度学习 自然语言处理 博客
《深度学习与自然语言处理(斯坦福cs224d)》by 寒小阳, 龙心尘 Lecture1:http://t.cn/R5bXEUf
http://ww1.sinaimg.cn/large/5396ee05jw1f4h5i8zlgoj20ci05gmxe.jpg
http://tva2.sinaimg.cn/crop.0.0.180.180.50/76b0e04fjw1e8qgp5bmzyj2050050aa8.jpg 老师木 网页版 2016-06-02 10:23
统计
【机器学习专家与统计学家观点上有哪些不同?】 saizheng:搞统计的人入ML的行,许多都会从Probably Approximately Correct (PA… http://t.cn/R5bhLjT
http://tva2.sinaimg.cn/crop.32.27.195.195.50/91452c91gw1ea1tgqkg77j2076076glv.jpg 电商行业 网页版 2016-06-02 08:30
Hal Varian 数据科学 统计
【干货 :什么是数据科学?如何把数据变成产品?】据哈尔•瓦里安(Hal Varian)说,统计学家是下一个性感的工作。五年前,在《什么是Web 2.0》里蒂姆•奥莱利(Tim O’Reilly)说“数据是下一个Intel Inside”。但是这句话到底是什么意思?为什么我们突然间开始关注统计学和数据?
http://ww3.sinaimg.cn/large/91452c91jw1f4gksfkpsuj20dc9gvu0y.jpg
http://tva2.sinaimg.cn/crop.0.0.768.768.50/972a1170jw1f1ht49te2vj20lo0lggnu.jpg 学生古 网页版 2016-05-26 11:55
会议活动 算法 自然语言处理 ICLR 会议 活动 机器翻译 神经网络
#ACL16#神经机器翻译(neural MT)长文8篇+短文3篇。除了一篇长文,其余10篇均已放出arXiv,有的已被引5次,有的来自ICLR16研讨会。关键词有:Character Word-character Monolingual Risk Coverage Subword Semi-Supervised Attentional Syntactically Vocabulary。 (以下是Github Markdown格式的论…全文:http://m.weibo.cn/2536116592/3979352070871737
http://ww4.sinaimg.cn/large/972a1170jw1f48ncwv3maj20pj0jx43w.jpg
最新动态
2016-06-02 (14)
http://tva2.sinaimg.cn/crop.0.0.136.136.50/684ff39bjw8ev5egxmyb7j203w03wdfq.jpg 36氪 网页版 2016-06-02 23:30
新闻
【大公司】今天,Facebook 推出了一款新的人工智能引擎产品 Deep Text。Deep Text 能够像人一样理解用户在 Facebook 上发布的所有内容和聊天信息的意思。Facebook发布人工智能引擎Deep Text,背后隐藏的是想成为一个强大搜索引擎的雄心http://t.cn/R5byCm1
http://tva2.sinaimg.cn/crop.10.34.646.646.50/5396ee05jw1ena6co8qiwj20sg0izjxd.jpg 爱可可-爱生活 网页版 2016-06-02 20:28
自然语言处理
《IKAnalyzer分词原理》by yushanzh http://t.cn/R5bKHOx
http://tva1.sinaimg.cn/crop.0.10.307.307.50/685a8f49gw1ebrrf7lnd8j208k0c8758.jpg 专注云计算 网页版 2016-06-02 18:45
架构 Spark
【用Spark进行大数据处理之机器学习篇(资料下载)】在本篇文章,作者将讨论机器学习概念以及如何使用Spark MLlib来进行预测分析。后面将会使用一个例子展示Spark MLlib在机器学习领域的强悍。http://t.cn/R5bUbem @江苏道法自然 @没人用我的名 @下岗工人01 @云创大数据
http://ww3.sinaimg.cn/large/685a8f49gw1f4gtqre7vsj20gt081758.jpg
http://tva3.sinaimg.cn/crop.0.0.399.399.50/6fc2c0e5gw1ejdakew0dnj20b40b4t8t.jpg 华尔街见闻APP 网页版 2016-06-02 16:40
深度学习 视觉 语音
【机器的“深度学习”会是交易的未来吗?这是最前沿的研究】在图像和语音识别等领域,深度学习技术的突破引起很大关注。但在金融领域这种技术距离大规模采用似乎仍遥远,不过这并不妨碍人们的研究热情。从预测股票挂单报价到预测股市波动率,深度学习技术的研究案例层出不穷。http://t.cn/R5bImS7
http://ww4.sinaimg.cn/large/6fc2c0e5gw1f4gyyowsg3j20h108lmxk.jpg
http://tva2.sinaimg.cn/crop.113.113.284.284.50/0060jr72jw8eorxcrqimhj30e80e8jsk.jpg 视觉机器人 网页版 2016-06-02 16:29
深度学习 视觉 资源 PDF
【深度学习、图形学】一种角色运动和成与编辑的深度学习框架(SIGGRAPH 2016)。http://t.cn/R5bIAjv 演示视频挺有趣,最后一堆人行走看起来好酷。 http://t.cn/R5bIAll简介:我们提出一个合成人物动作的框架,立足于高层次的参数,通过大量的动作捕捉数据集,使得产生的的运动符合人体自然的运动…全文:http://m.weibo.cn/5501429448/3981957677303047
http://tva1.sinaimg.cn/crop.93.80.283.283.50/005SEzc3jw8eo12vpu6m7j30dm0dcq3u.jpg bigdata-research 网页版 2016-06-02 16:06
行业动态
如何用阿里云的机器学习得出泰坦尼克号沉船事件中谁有更大的概率获救 | 36大数据http://t.cn/R5bf2Cw
http://ww4.sinaimg.cn/large/005SEzc3jw1f4gxz8agmtj30hs0b8wh5.jpg
http://tva1.sinaimg.cn/crop.0.10.307.307.50/685a8f49gw1ebrrf7lnd8j208k0c8758.jpg 专注云计算 网页版 2016-06-02 14:45
公告板 自然语言处理 问答系统
【科技公司们都在谈人工智能,但它们的做法有什么不同?】不温不火的 Siri 没有影响到巨头们对人工智能的爱。http://t.cn/R5b2PSW
http://ww2.sinaimg.cn/large/685a8f49gw1f4gtmuzn3nj20fk09bt96.jpg
http://tva1.sinaimg.cn/crop.0.10.307.307.50/685a8f49gw1ebrrf7lnd8j208k0c8758.jpg 专注云计算 网页版 2016-06-02 14:01
深度学习 算法
【深度学习新算法,完成字里行间的情绪识别】深度学习领域是计算机科学一个新兴领域,通俗说来就是构建像人脑一样处理数据的计算机程序。深度学习首先发起于学术界,目前各大互联网巨头也纷纷投入研究,http://t.cn/R5bysw0
http://ww1.sinaimg.cn/large/685a8f49gw1f4gtllvmz8j208c0460su.jpg
http://tva2.sinaimg.cn/crop.10.34.646.646.50/5396ee05jw1ena6co8qiwj20sg0izjxd.jpg 爱可可-爱生活 网页版 2016-06-02 13:50
经验总结 算法 Adrian Colyer 博客 神经网络
notes on 《Sequence to sequence learning with neural networks》by Adrian Colyerhttp://t.cn/R5bU0gk
http://ww3.sinaimg.cn/large/5396ee05jw1f4gu1bmi3hj20vg0az41b.jpg
http://tva2.sinaimg.cn/crop.0.0.768.768.50/972a1170jw1f1ht49te2vj20lo0lggnu.jpg 学生古 网页版 2016-06-02 13:16
会议活动 算法 应用 KDD 广告系统 行业动态 会议 推荐系统
分解机(LibFM)、开源推荐算法包(MyMediaLite)、个性化排序(BPRMF)作者Steffen Rendle等KDD16:Robust Large-Scale Machine Learning in the Cloud 谷歌云上的大规模健壮机器学习系统:广义线性模型的分布式坐标下降法。 评估数据集是谷歌广告,1T样本,比Netflix还大1万倍 http://t.cn/R5byqUO
http://ww1.sinaimg.cn/large/972a1170jw1f4gsovephkj20q60lp7er.jpg
http://tva2.sinaimg.cn/crop.113.113.284.284.50/0060jr72jw8eorxcrqimhj30e80e8jsk.jpg 视觉机器人 网页版 2016-06-02 11:49
深度学习 算法 Omer Shamir
【深度学习】这篇包含5个章节的文章,是关于ConvNets内核的技术分析:算法,实现和优化。它是关于ConvNets是如何产生的。Laws, Sausages and ConvNets(2016-06-01):http://t.cn/R54Bm4x 包括卷积、反向传播、准线性、重叠性、多维性等,感觉好高大上。作者:Omer Shamir
http://ww1.sinaimg.cn/large/0060jr72jw1f4gqizl8poj30pk1hcx2v.jpg
http://tva3.sinaimg.cn/crop.0.0.588.588.50/6325c139gw1f2v5j4p003j20gf0l0dl6.jpg 程序员编辑部 网页版 2016-06-02 09:13
深度学习
6月新一期《程序员》与读者见面了——“人工智能60年,后深度学习时代关键技术进展”,点击了解文章概要 http://t.cn/R54Fekn
http://tva1.sinaimg.cn/crop.0.0.300.300.50/3f116d0bjw8eswvghzr9zj208c08cdgi.jpg 沈阳日报 网页版 2016-06-02 07:30
视觉
【沈阳:民警处警全程视频监控 全市229个派出所办案进程随时查】“家里被盗,丢失大量首饰,但不知道现在案件进展到哪一步了?”5月31日下午,和平区李女士来到市公安局案件管理中心,经民警在受案立案信息系统中查询了解到,此案正处于辖区派出所侦破之中,此后又调出当时办案民警执法记录仪上存储的…全文: http://m.weibo.cn/1058106635/3981822218622506
http://tva3.sinaimg.cn/crop.0.0.180.180.50/9b27a3ebjw1e8qgp5bmzyj2050050aa8.jpg _dailu_ 网页版 2016-06-02 05:59
经验总结 深度学习 资源 博客 书籍
发表了博文《当人工智能谈论写作时,他们在谈些什么》(用深度学习理论去学习武侠小说、网络小说、唐诗宋词,乃至色情小说、政府报告,人工智能将写出什么?本文一步步揭示了人工智能学习写作的过程。)三月是人工智http://t.cn/R54rg8M
http://ww1.sinaimg.cn/large/9b27a3ebjw1f4ggg02uhnj20j60cigmq.jpg
whigzhou 网页版 转发于2016-06-02 14:31回复 @whigzhou “给各种后现代哲学和社会批判类期…”
机器智能的进一步提升需要多感官来源,不同信息来源的系统相互之间提供反馈,并且基于这些系统在更高层次上产生新模型,此时所谓“真正的理解”便出现了
whigzhou 网页版 转发于2016-06-02 14:37回复 @whigzhou “机器智能的进一步提升需要多感官…”
通俗而粗略的说,机器并不“真正理解”“甜”字的意思,只不过是因为他没吃过糖,那就给他加些味觉传感器,或者直接喂化学结构数据库也可以
whigzhou 网页版 转发于2016-06-02 14:49
其实学起来最麻烦的是和主体性相关的那些知识,首先他要认识到自己是个利益主体(这一点恐怕只能设计者预先给定),其次他需要获得有关得失成败的经验,而这种经验仅靠感觉是不够的,还需要行动,主体性知识只能由经验-决策-行动-反馈这样的学习回路才能获得,困难在于,机器还不被允许自主行动。
whigzhou 网页版 转发于2016-06-02 14:52回复 @whigzhou “其实学起来最麻烦的是和主体性相…”
所以在现阶段,主体性知识的学习只能在网络游戏和社交网这样虚拟空间中进行,距离真实世界还很远,这会妨碍他对许多概念的理解,而在人类语言中,与主体性有关的概念是无处不在的
温故知新 (1)
更早的微博,有新精彩评论或被再次推荐
2016-06-01 (1)
http://tva2.sinaimg.cn/crop.113.113.284.284.50/0060jr72jw8eorxcrqimhj30e80e8jsk.jpg 视觉机器人 网页版 2016-06-01 22:16
会议活动 经验总结 深度学习 视觉 ICLR Tomasz Malisiewicz 博客 会议
【深度学习】插播一条紧急技术资讯[太开心]。4个小时前Tomasz Malisiewicz发布了最新的ICLR2016的深度学习的趋势分析(Deep Learning Trends @ ICLR 2016),博文:http://t.cn/R54CGCA 该作者博文虽少,但篇篇精彩,之前SLAM博文写的很棒:http://weibo.com/5501429448/DlK6IiEIt 大家好好加班
http://ww2.sinaimg.cn/large/0060jr72gw1f4g310h62vj30ku4moqv6.jpg
页:
[1]