解应春BW 发表于 2015-7-2 11:23:22

机器学习日报 2015-07-01 BigML特性介绍;Ensemble方法;人脸识别技术的演进;开源中文分词

机器学习日报 2015-07-01
[*]中文语义依存分析器 @刘挺
[*]如何通过Ensemble的方式提高数据科学竞赛的成绩 @吴甘沙
[*]常用的开源中文分词工具 @网路冷眼
[*]BigML特性介绍和入门教程 @CSDN云计算
[*]从How-Old.net看人脸识别技术的演进和基础环节 @cswhjiang

@好东西传送门 出品, 过往目录 见http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

邮件版包括20条,本期的Web版有完整内容33条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp3.sinaimg.cn/1654619934/50/5650289059/1 刘挺 网页链接 2015-07-01 22:04
算法 自然语言处理
我实验室(负责算法、软件开发)与北京语言大学“语言监测与社会计算研究所”(负责数据规范与标注)联合研制的“中文语义依存分析器”上线了,http://t.cn/zQnuTXn中。依存弧上的关系从“句法关系”改为“语义关系”,参见图片中的对比。语义依存分析结果将可以直接服务于问答、信息抽取等应用。
http://ww1.sinaimg.cn/large/629f7f1egw1etnmhru3mcj20ho0fm755.jpg


http://tp1.sinaimg.cn/1557337604/50/5651912525/1 吴甘沙 网页链接 2015-07-01 22:54
经验总结 Kaggle 博客 数据科学 集成学习
计算机学会大专委主办的中国好创意数据大赛马上开始了,这里几篇讲述了如何通过Ensemble的方式提高数据科学竞赛的成绩 http://t.cn/RLhHZ1r http://t.cn/RLhHZ1B http://t.cn/RLhHZ11



http://tp3.sinaimg.cn/1715118170/50/5653230631/1 网路冷眼 网页链接 2015-07-01 21:47
算法 自然语言处理 CRF
【常用的开源中文分词工具】由于中文文本词与词之间没有像英文那样有空格分隔,因此很多时候中文文本操作都涉及切词,这里整理了一些中文分词工具。用CRF实现的分词工具的处理速度是比较慢的(训练CRF模型是非常耗时的),但是精度高,涉及CRF的分词工具有CRF++,斯坦福分词工具 http://t.cn/R22V6nw



http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页链接 2015-07-01 10:00
入门 资源 课程
【机器学习即服务之BigML特性介绍和入门教程】机器学习即服务(MLaaS)的争夺战已经打响,BigML是其中的一个竞争者。本文详细介绍了BigML机器学习服务的特性和使用过程,作者认为BigML比AmazonML、AzureML等更接近于SaaS,支持跨云导入数据是它的一个优势。http://t.cn/RLPccdg



http://tp1.sinaimg.cn/2358675560/50/5646390744/1 cswhjiang 网页链接 2015-07-01 10:00
统计
【作为统计的博士生,你都读过哪些对你影响深远的统计书籍?】腾冷 : 推荐几本: 1. Elements of Statistical Learning by Hastie, etc... 2. Concentration Inequaliti… http://t.cn/RLPk8Dz(分享自 @知乎)



最新动态
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-07-01 21:31
资源 会议活动 KDD PDF 会议 教育网站 迁移学习
【论文:用于MOOC辍学预测的迁移学习模型】《Transfer Learning for Predictive Models in Massive Open Online Courses》S Boyer, K Veeramachaneni (2015) 参加今年KDD Cup 2015的童鞋们可以参考下http://t.cn/RLhOkMm pdf:http://t.cn/RLhOkMu
http://ww4.sinaimg.cn/large/5396ee05jw1etnlhyiregj20jx08d3zx.jpg

爱可可-爱生活 网页链接 转发于2015-07-01 21:33
相关报道《New techniques could help identify students at risk for dropping out of online courses》http://t.cn/RLhWAaS


http://tp3.sinaimg.cn/1715118170/50/5653230631/1 网路冷眼 网页链接 2015-07-01 21:31
算法 Java 分类 集成学习
【一个理解机器学习增强(Boosting)算法的尝试】http://t.cn/RLhODXg 它是一种可以用来减小监督式学习中偏差的机器学习元算法。迈可·肯斯提出:一组“弱学习者”的集合能否生成一个“强学习者”?弱学习者一般是指一个分类器,它的结果只比随机分类好一点点;强学习者指分类器的结果非常接近真值。
http://ww4.sinaimg.cn/large/663aa05agw1etni2hwkkzj20p26rb1kx.jpg


http://tp1.sinaimg.cn/1223975960/50/5677464187/1 数学与艺术MaA 网页链接 2015-07-01 21:28
Thomas Bayes 统计
【解密世界的方程式——贝叶斯公式】英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系。就是这样一个中学生都能明白的公式正成为我们理解世界的钥匙,正是能够描述我们的思想活动的数学:http://t.cn/RLhOnMF;http://t.cn/RLhOnMk;http://t.cn/haY0x
http://ww1.sinaimg.cn/large/48f46418gw1etnlfw8bnfj20dw08ywew.jpg


http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页链接 2015-07-01 17:37
应用 算法 自然语言处理 信息检索 神经网络
【基于深层神经网络的命名实体识别技术】命名实体识别是从文本中识别具有特定类别的实体,例如人名、地名、机构名等。命名实体识别是信息检索,查询分类,自动问答等问题的基础任务,其效果直接影响后续处理的效果,因此是自然语言处理研究的一个基础问题。http://t.cn/R21q4Ao



http://tp1.sinaimg.cn/1642720480/50/40020887226/1 爱范儿 网页链接 2015-07-01 12:30
视觉 新闻
【每个耳朵都是唯一,亚马逊玩“耳纹识别”】指纹识别即将成为很多手机的标准配置,那么还有啥安全技术能够挖掘?亚马逊认为耳纹识别可能是一个可能的方向,毕竟耳朵是我们的手机最熟悉的身体部位之一了。http://t.cn/RLh7vti
http://ww4.sinaimg.cn/large/61e9ece0jw1etn49b83vcj20dt0hw0th.jpg


http://tp3.sinaimg.cn/2311005302/50/5670138351/1 GPU计算 网页链接 2015-07-01 11:44
会议活动 深度学习 David Kirk GPU 会议 活动
在昨天举办的GPU加速深度学习研讨会·广州站中,NVIDIA首席科学家David Kirk亮相并做了开幕致辞,成为了本次研讨会的最大亮点。David Kirk于1997年加入NVIDIA,主持过多项图形技术的开发工作,他在图形设计领域拥有50项专利以及专利申请,并发表过50多篇关于图形技术的论文。
http://ww3.sinaimg.cn/large/89bf2476jw1etn4bf0jkxj20zk0np773.jpg


http://tp1.sinaimg.cn/1496874104/50/5729851572/0 杨静Lillian 网页链接 2015-07-01 11:37
资源 深度学习 顾嘉唯 幻灯片 行业动态
【百度顾嘉唯】从万物互联到万物智能 http://t.cn/RLh7Ygz 百度研究院人机交互研究带头人顾嘉唯近期在【东方电子】策略会分享了百度在物联网上的布局思路,以及深度学习和智能硬件之间的关系和百度对于人工智能的思考,以下是他长达1万3千字的发言观点总结和22页PPT图文实录。


杨静Lillian 网页链接 转发于2015-07-01 11:39
【顾嘉唯观点】我们正从万物互联走向万物智能的时代,人机交互和人工智能是重要的技术基础,如何创造技术产品,通过不断自我学习演进,感知场景变化,使得用户连接服务变得更加智能,变得尤为重要;人工智能有机会把人从脑力劳动和智力劳动解放出来,并逐渐取代这些节点中的不必要的人类活动。


http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页链接 2015-07-01 10:00
视觉 深度学习 孙剑
【从How-Old.net看人脸识别技术的演进和基础环节】微软亚洲研究院视觉计算组首席研究员孙剑博士撰写了本文,他基于近期的两项人脸识别应用,深入浅出的介绍了这项应用背后的深度学习方法、人脸识别基础环节等内容。http://t.cn/RLPVXGc



http://tp2.sinaimg.cn/3227020453/50/5656309782/1 自动化网官方微博 网页链接 2015-07-01 09:16
应用 视觉 资源 课程 机器人
【第二届模式识别讲习班在自动化所成功举办】此次讲习班的学习和讨论内容涉及智能感知、运动控制、仿生材料机器人、模式识别、视觉计算、三维重建等多个研究领域,共吸引了来自北京大学、清华大学、中山大学、中科院沈阳自动化所、北京交通大学的90多名学员参加。 http://t.cn/RLPeAM2
http://ww2.sinaimg.cn/large/c0586ca5jw1etn0aarqr4j20go0b3q4y.jpg


http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-07-01 08:31
视觉 资源 深度学习 自然语言处理 简报
机器学习日报 2015-06-30 http://t.cn/RLPrju6 1) 8佳机器学习速查表 2) Google Earth应用深度学习 3) Ask Me Anything: Dynamic Memory Networks for NLP 4) 应该立法禁止切词研究 5) 面向机器视觉的深度学习资源汇总 完整版35条 http://t.cn/RLPrjuX
http://ww2.sinaimg.cn/large/005HjjGQgw1etmyzeyc2sj30i20g1jtw.jpg


http://tp4.sinaimg.cn/3847741679/50/5710230990/1 数盟社区 网页链接 2015-07-01 08:28
算法 视觉 深度学习 神经网络
【Adam:大规模分布式机器学习框架】Adam是微软研究院的深度学习项目,该项目仍然是应用卷积神经网络进行图像分类,效果提高了很多。adam更偏向于分布式框架的实现,而非理论的创新。http://t.cn/RLPrKd4
http://ww4.sinaimg.cn/large/e557e0efjw1etmyww2nf3j208c08caao.jpg


http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-07-01 07:20
语音 深度学习 自然语言处理 Yann Lecun 分布式学习
NLP日报 2015-06-30 http://t.cn/RLP3xU1 1) 论文: Topic2Vec: Learning Distributed Representations of Topics 2) 论文: Ask Me Anything: Dynamic Memory Networks for Natural Language Processing 3) Yann LeCun讲座: 面向文本/语音识别的深度学习 完整版13条 http://t.cn/RLP3xU3
http://ww4.sinaimg.cn/large/005HjjGQgw1etmwy3fe8uj30h40ctjsh.jpg


http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-07-01 07:00
视觉 资源 深度学习 GPU Python
计算机视觉日报 2015-06-30 http://t.cn/RLPupsA 1) 计算机视觉深度学习干活资源集合 2) Python下基于CNN的图像理解 3) 面向图像识别的(基于GPU)深度学习 4) 基于DNN的姿态估计DeepPose 5) GPU加持深度学习进行猫脸识别 完整版12条 http://t.cn/RLPups2
http://ww1.sinaimg.cn/large/005HjjGQgw1etmwckofj9j30k00sudha.jpg


http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-07-01 06:40
资源 Kaggle 代码 视频 数据科学
【视频+代码:基于Kaggle's Titanic 101数据的(R)数据科学实践】《Introduction to Data Science with R - Data Analysis》Youtube:http://t.cn/RLPmFpF http://t.cn/RLPmFpD 云: http://t.cn/RLPmF0P http://t.cn/RLPmFpkGitHub:http://t.cn/RLPmFpe


phunter_lau 网页链接 转发于2015-07-01 06:46
titanic这个比赛可能是最好的数据科学入门短平快教学,同学们搞起来,当体面的数据科学家挣钱买车娶媳妇啊


http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-07-01 06:02
资源 自然语言处理 PDF Python 代码 教育网站
【论文+代码:非分布式(Non-distributional)词向量表示】《Non-distributional Word Vector Representations》M Faruqui, C Dyer (ACL2015) http://t.cn/RLPnga3 GitHub(Python):http://t.cn/RLPnga1
http://ww1.sinaimg.cn/large/5396ee05jw1etmumzhv96j20cp0860u8.jpg



页: [1]
查看完整版本: 机器学习日报 2015-07-01 BigML特性介绍;Ensemble方法;人脸识别技术的演进;开源中文分词