机器学习日报 2016-01-15 香港中文大学多媒体实验室人脸检测Benchmark;机器学习数据集Yahoo ...
机器学习日报 2016-01-15[*]Yahoo发布有史以来最大规模机器学习数据集Yahoo News Feed dataset @爱可可-爱生活
[*]+NIPS2015大会洞察 @微软亚洲研究院
[*]Michael I. Jordan(Berkeley)推荐的机器学习图书列表 @爱可可-爱生活
[*]香港中文大学多媒体实验室(汤晓鸥)人脸检测Benchmark @视觉机器人
[*]开源:(Python)聚焦NLP的深度学习库Quagga @爱可可-爱生活
@好东西传送门 出品, 过往目录 见http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报
邮件版包括20条,本期的Web版有完整内容32条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-01-15 04:54
【Yahoo发布有史以来最大规模机器学习数据集Yahoo News Feed dataset】《Yahoo Releases the Largest-ever Machine Learning Dataset for Researchers | Yahoo Labs》 "110B events (13.5TB uncompressed) of anonymized user-news item interaction data" http://t.cn/R4W4pl6
http://ww4.sinaimg.cn/large/5396ee05jw1ezzpf6kcmij20nn0ghahk.jpg
爱可可-爱生活 网页链接 转发于2016-01-15 11:07
@cnBeta 提供的中文介绍《雅虎面向研究人员发布大规模机器学习数据集》 http://t.cn/R4WafkD
http://tp3.sinaimg.cn/1286528122/50/40028223938/1 微软亚洲研究院 网页链接 2016-01-15 18:25
会议活动 经验总结 NIPS 博客 会议 林添
【机器学习的盛宴】NIPS大会是机器学习和神经计算领域的顶级会议。本届NIPS参会学者人数近4000名,而录取论文数却仅有403篇,微软研究院就在里面贡献了24篇论文哦~12月的加拿大极其寒冷,但#NIPS2015#会场内却十分火热。让微软亚洲研究院实习生林添和你分享他的大会洞察>>http://t.cn/R4lbolG
http://ww3.sinaimg.cn/large/4caedc7agw1f00cs6a2a0j20ij287wwg.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-01-15 14:39
经验总结 资源 Honglang Wang Michael Jordan 博客 书籍
【Michael I. Jordan(Berkeley)推荐的机器学习图书列表】《Machine Learning Books Suggested by Michael I. Jordan from Berkeley | Honglang Wang's Blog》http://t.cn/R4l7hKW
http://tp1.sinaimg.cn/5501429448/50/5717596146/1 视觉机器人 网页链接 2016-01-15 14:36
深度学习 视觉 算法 教育网站 汤晓鸥
#资源共享# 香港中文大学多媒体实验室(汤晓鸥)的人脸检测Benchmark即WIDER FACE v1.0:http://t.cn/RU1oQwk 2015-11-19发布,基线为ACF, Faceness, Multiscale Cascade CNN, and Two-stage CNN算法,包含32203图像共393703人脸标注,远大于FDDB的2845图像5171个人脸。评估方法与PASCAL VOC数据集相同
http://ww4.sinaimg.cn/large/0060jr72gw1f0067ymh1uj31kw0ivtk3.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-01-15 09:54
深度学习 算法 自然语言处理 Python 代码 神经网络
【开源:(Python)聚焦NLP的深度学习库Quagga】"a library for building and training neural networks for NLP tasks" GitHub:http://t.cn/R4W9fQn Doc:http://t.cn/R4W9fQE
言语挖挖 网页链接 转发于2016-01-15 11:14
看了下char-RNN的例子,没有动力跟进了。不明白这样的东西有神马前途。在神经网络眼中,NLP的特异性还有多重要呢?
最新动态
http://tp2.sinaimg.cn/1852299857/50/5747788607/0 屠龙的胭脂井 网页链接 2016-01-15 21:55
神经科学
给做脑科学的同学们推荐个网站Author Synth:http://t.cn/R4lNpSc 在这里,你可以在关键字矩阵里通过关键字(比如Chinese,中文在大脑啊分布)找到相应作者,再从作者矩阵找到作者的关键字,和与其他作者相关度,paper,已经他paper中已经发表的相关区域的3d坐标。对看paper还是很有帮助的[笑cry]
http://ww3.sinaimg.cn/large/6e67da51gw1f00iurxp1ej21kw11x491.jpg
http://tp1.sinaimg.cn/1181564472/50/5714573383/1 ML_Yuens 网页链接 2016-01-15 20:27
算法 自然语言处理 SVM 神经网络
【Support Vector Machines vs Artificial Neural Networks】svms.org网站上一篇神经网络和支持向量机的对比文章,这里做简单翻译,如有错误请在下方评论处留言,感谢作者!感谢爱可可-爱生活分享! 1. SVM最重要的优点 The development of ANNs followed a… http://t.cn/R4l6KVs
http://tp3.sinaimg.cn/1286528122/50/40028223938/1 微软亚洲研究院 网页链接 2016-01-15 19:26
经验总结 深度学习 视觉 算法 语音 博客 神经网络
【更深的神经网络】语音识别、图像识别等技术正融入我们生活的方方面面,而这都源于深度学习技术的日益进步。微软亚洲研究院不久前凭借152层神经网络打造了世界上最精确的计算机识别系统引起了业界的广泛关注>http://t.cn/R4zKFKZ看《连线》杂志是如何解读“更深的神经网络”的>http://t.cn/R4WMy9n
http://ww2.sinaimg.cn/large/4caedc7agw1f00elro011j20bs0xxq4y.jpg
http://tp2.sinaimg.cn/2057993277/50/5725158337/1 新锋网-爱应用 网页链接 2016-01-15 18:15
视觉 资源 视频
微软今年将发布开发人员版本的 HoloLens,这些 HoloLens 软件开发人员将带领我们进入这个令人振奋的新世界。但是他们应该如何利用这个平台?似乎并不是很困难,微软在其 HoloLens Youtube 频道发布了一段新视频,专门介绍 HoloLens 应用开发。http://t.cn/R4lw8k5
http://tp2.sinaimg.cn/5192813105/50/5698640042/0 LinuxStory 网页链接 2016-01-15 17:41
资源 自然语言处理 课程 正则表达式
#LinuxStory 分享时间# 三分钟教你轻松掌握 grep 命令中的正则表达式 | 系统自带了支持拓展正则表达式的GNU版本grep工具。grep命令被用来检索一台服务器或工作站上任何位置的文本信息。本文将结合例子深度解析grep命令的使用方法。绝对够干货!<ls作者:@斜桥夕阳 > 教程详情: http://t.cn/R4lqj7T
http://tp2.sinaimg.cn/1819454013/50/40049237856/1 微软学术合作 网页链接 2016-01-15 17:29
自然语言处理 宋睿
【互联网搜索中大数据研究的两大趋势】@微软亚洲研究院 主管研究员宋睿华认为,未来互联网搜索中的大数据研究主要有两大趋势:1、用“搜索”索引大数据,从中挖掘新知识;2、利用大数据提供的“大语料”,将"意义相近但长相不同"的词联系起来,突破目前模糊词搜索的局限。[奥特曼]详情↓↓↓
http://ww3.sinaimg.cn/large/6c72aa3dgw1f00b1yvgcuj20m83164qp.jpg
http://tp2.sinaimg.cn/3227020453/50/5656309782/1 自动化网官方微博 网页链接 2016-01-15 17:12
深度学习 行业动态
【百度开源其关键人工智能系统 WARP-CTC】百度硅谷 AI 研究所 开源了百度的关键人工智能 软件 WARP-CTC,基于 Apache 协议,WARP-CTC 的 C 语言库和可选 Torch 绑定都已托管到 GitHub:基于 CTC 方法,当前可用的一些 CTC 实现通常要求大量的内存或者是慢十到几百倍。#人工智能#http://t.cn/R4WXsUA
http://ww1.sinaimg.cn/large/c0586ca5jw1f00aqjj8vrj20lh0cd762.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-01-15 16:41
深度学习 资源 Python 可视化 课程 数据科学
24小时分享排行:1、【Python数据科学入门完全指南】2、【Github十大深度学习开源项目】3、【基于MXNet的CNN典型架构可视化】4、【Yahoo发布大规模机器学习数据集Yahoo News Feed dataset】5、【90+页的Twitter社交数据分析教程】…… http://t.cn/R4lU9eg
http://tp1.sinaimg.cn/2311077472/50/5682227943/1 证券日报之声 网页链接 2016-01-15 16:00
算法
【京东金融投资大数据公司数库 构建完整底层数据生态】随着京东金融在科技风控及大数据领域的不断开拓,其金融生态日渐完整。近日,京东金融宣布投资了基于机器学习算法的大数据量化分析公司——数库,并宣布双方将在金融产业大数据领域展开深入的合作。http://t.cn/R4l20Az
http://ww3.sinaimg.cn/large/89c03e60jw1f008nkh53uj20ad064mxa.jpg
http://tp2.sinaimg.cn/1937649537/50/5710058572/1 IBM中国 网页链接 2016-01-15 14:56
会议活动 会议
#IBM 新闻直通车#商业医疗保健行业的领导者Pathway Genomics和IBM日前在CES 2016数字健康峰会联合发布了由IBM Watson支持的Pathway Genomics OME™应用的Alpha版本,以助力Pathway Genomics为消费者提供个性化健康信息。http://t.cn/R4lzUyv
http://ww4.sinaimg.cn/large/737e2f81gw1ezzzr8asf0j20dy0e0jrs.jpg
自动化网官方微博 网页链接 转发于2016-01-15 15:33
Pathway的OME应用将根据Pathway Genomics的基因检测的结果,同时结合了IBM Watson认知计算技术、#机器学习#能力以及大量的健康保健信息的用户数据进行专业分析,从而为用户提供个性化的健康建议。[给力] #医疗信息化#
http://tp4.sinaimg.cn/1750070171/50/5734745738/1 36氪 网页链接 2016-01-15 13:25
新闻
快讯 | 【雅虎公布13.5TB用户数据促进人工智能开发】雅虎公司昨天宣布,公司将公布最大规模的互联网行为数据,数据涉及浏览雅虎体育、雅虎财经、雅虎新闻、雅虎地产和其他版块的2000万匿名用户。据悉,雅虎此次公布的数据体积为13.5 TB,相当于美国国会图书馆数据体积的2/3。详情:http://t.cn/R4Wekef
http://ww1.sinaimg.cn/large/684ff39bjw1f003qhaoc0j212w0pwtey.jpg
http://tp1.sinaimg.cn/5501429448/50/5717596146/1 视觉机器人 网页链接 2016-01-15 10:48
视觉
#资源共享# OpenCV进行图像处理的一些基础:http://t.cn/8F0rcmE 图像读写、展示、访问像素、图像通道、简单图像运算、感兴趣区域(ROI)、图像变换、直方图、空间滤波、图像金字塔、图像分割、形状检测、形状拟合、形状特征。网页设计挺不错,没有广告,看着就有学习的欲望
http://ww4.sinaimg.cn/large/0060jr72gw1ezzzmi6gw4j30560ciq3g.jpg
http://tp2.sinaimg.cn/5606690513/50/5735097632/1 技术头条 网页链接 2016-01-15 09:19
架构 资源 Python Spark 课程
【Spark入门教程(针对Python)】本文用一个真实的数据集,展示Spark的结构,以及基本的转换(transformations)与行动(actions)。如果你想尝试编写和运行自己的Spark代码,可以到Dataquest试试本教程的(英文)互动版本。 by @Datartisan http://t.cn/R4WS3Vy(分享自 @技术头条)
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-01-15 06:44
算法 资源 PDF 分类 集成学习 矩阵 可视化
【论文:EnsembleMatrix:多分类器机器学习交互可视化】《EnsembleMatrix: Interactive Visualization to Support Machine Learning with Multiple Classifiers》J Talbot, B Lee, A Kapoor, DS Tan (2009)http://t.cn/8kgl8Ps
http://ww3.sinaimg.cn/large/5396ee05gw1ezzsle4mepj20ix0axdio.jpg
http://tp4.sinaimg.cn/3193816967/50/40011594791/1 洪亮劼 网页链接 2016-01-15 02:53
应用 推荐系统
今天,雅虎研究院我们个性化研究组发布了到目前为止,公开的最大的机器学习数据集(http://t.cn/R4W4pl6),有2千万用户1.1亿个访问记录,总计13.75TB的解压数据。这不仅是到目前为止最大的机器学习数据集,也是最大的个性化和推荐系统数据集。欢迎相关研究人员使用。
页:
[1]