VALSE

查看: 5446|回复: 0

机器学习日报 2015-07-18 机器学习的两大挑战;关联聚类;图片hashtag预测;神经机器翻译

[复制链接]

829

主题

837

帖子

7万

积分

版主

Rank: 7Rank: 7Rank: 7

积分
78980
QQ
发表于 2015-7-19 15:26:37 | 显示全部楼层 |阅读模式
机器学习日报 2015-07-18

@好东西传送门 出品, 过往目录 见http://ml.memect.com



订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报   或点击




本期话题有:

全部25 算法10 应用8 资源7 自然语言处理6 深度学习3 会议活动3 经验总结3 公告板2 语音1


用日报搜索找到以前分享的内容: http://ml.memect.com/search/

今日焦点 (5)


王威廉   网页版 2015-07-17 08:02
会议活动 算法 资源 ICML Leon Bottou PDF 幻灯片 会议
脸书人工智能实验室的SGD著名专家Leon Bottou在ICML的主题演讲上提出了机器学习的两大挑战:1)机器学习在软件工程的应用中存在的一些难点。2)现在的机器学习研究中的实验设计往往有很大的问题。幻灯片:http://t.cn/RLy9tDn Leon思考很有深度,建议一看。






爱可可-爱生活   网页版 2015-07-18 21:44
算法 资源 PDF 聚类
【幻灯:关联聚类——从理论到实践】《Correlation Clustering: from Theory to Practice》by F Bonchi, D Garcia-Soriano, E Liberty [Yahoo] (2014) http://t.cn/RLIPd1Z云:http://t.cn/RLIPd14







iB37   网页版 2015-07-18 21:39
深度学习 算法 应用 资源 PDF 行业动态 预测
组合用户特征(年龄 性别 地域等)和图片特征(CNN学习而来), 用于图片hashtag预测: 0)不加用户特征; 1)特征拼接法; 2)用户特征条件化的3路(张量)乘性门. User Conditional Hashtag Prediction for Images [Denton,KDD15] http://t.cn/RLIPl5v PS:NYU去FAIR实习类似于哈工大去百度实习那样机会更多吧







iB37   网页版 2015-07-18 17:02
算法 资源 自然语言处理 PDF 机器翻译 教育网站 神经网络
去年十月份放在arXiv文章<神经机器翻译中稀有词问题的缓解>被ACL15录用 Addressing the Rare Word Problem in Neural Machine Translation [Luong,ACL15] 未登录词(out-of-vocabulary)不是简单的统一记为unk,而是为每个目标端句子中的OOV词确定其在源语言句子中的*对齐*位置信息 http://t.cn/RLfmktM





鲁东东胖 网页版 转发于2015-07-18 17:06
很有用的工作,虽然我不喜欢他们的思路(可能只适用于距离比较近的语言),总觉得在这个问题上可以从传统的机器翻译中借鉴一下想法


算文解字 网页版 转发于2015-07-18 17:17
思路略naiive,应该可以做得更好


张家俊MT 网页版 转发于2015-07-18 17:24  回复 @鲁东东胖 “很有用的工作,虽然我不喜欢他们…”
机器翻译可能很难用一个漂亮简单的end-to-end模型完全解决,如果当Neural MT成为标准模型,研究者或开发者们也难免要往该模型中打各种补丁


鲁东东胖 网页版 转发于2015-07-18 17:26  回复 @张家俊MT “机器翻译可能很难用一个漂亮简单…”
需要一些额外的措施来补救一些问题,但是这个问题还是可以有比较systematic的思路,补丁也可以打的很elegant…


鲁东东胖 网页版 转发于2015-07-18 18:47  回复 @绝对零度nju “一直很好奇NMT在zh-en效果如何”
我们最近(http://t.cn/R2rs3TA)在一百万句对的中英语料上把NMT push到了和Moses(短语,无大语料LM)差不多的水平,但是目前和传统模型中效果最好的setting比应该还是有一定的差距,不准确的地方请@孟凡东_ICTNLP 指正


孟凡东_ICTNLP 网页版 转发于2015-07-18 19:13  回复 @鲁东东胖 “我们最近( http://t.cn/R2rs3TA…”
参数没有增加很多,也没有做任何后处理(在词汇表上NMT是略吃亏的),目前与Moses的短语模型效果相当,与最好的SMT模型还有一定差距




iB37   网页版 2015-07-18 11:00
资源 自然语言处理 PDF
提升词重要性估计用于新闻多文档摘要 Improving the Estimation of Word Importance for News Multi-Document Summarization [Hong,EACL14] 词权重: 概率/词频, 对数似然率(话题词), 马尔科夫随机游走模型. 摘要生成过程: 贪心选择法, KL散度法. 全局重要性词. 富特征关键词抽取http://t.cn/RLfoUFY







最新动态
2015-07-18 (15)


南大周志华   网页版 2015-07-18 22:56
有幸担任Kyoto Prize提名人,梳理了一下信息科学历届得主及理由(清一色图灵奖):1988, J. McCarthy, 人工智能;1992, M. Wilkes, 体系结构;1996, D. Knuth, TAOCP+TEX;2000, T. Hoare, 软件科学;2004, A. Kay, 个人计算;2008, R. Carp, 计算复杂度理论;2012, I. Sutherland, 图形学与交互界面






199IT-互联网数据中心   网页版 2015-07-18 22:21
算法 统计
【机器学习和统计模型的差异】机器学习:一种不依赖于规则设计的数据学习算法。统计模型:以数学方程形式表现变量之间关系的程式化表达。这确实是一个难以回答的问题。考虑到解决问题的相似性,两者区别似乎仅仅在于数据量和模型建立者的不同。通过数十年发展二者差异性越来越小。http://t.cn/RLI7uOT






爱可可-爱生活   网页版 2015-07-18 21:34
算法 应用 Kaggle 预测
【Kaggle代码:Kaggle’s Property Inspection Prediction数据集探索性分析】《Explore Dataset – Property Inspection Prediction – updated》http://t.cn/RLIPiQR







格灵深瞳   网页版 2015-07-18 18:52
公告板 应用 资源 机器人 视频
【TED:人工智能会给我们带来怎样的世界?】http://t.cn/8DDscTq 我们正在创造一个技术越来越多,就业机会却越来越少的新世界。技术进步使得我们可以持续维持令人惊叹的产出,机器人也开始逐渐承担一些工作,并且比人要做的更好。一切的一切似乎都是在预示着就业危机的到来,但是,真的是这样的吗?







机器学习那些事儿   网页版 2015-07-18 15:00
算法 应用 推荐系统
基于机器学习方法的POI品类推荐算法 – 美团技术团队 http://t.cn/Rz3vbV8




机器学习那些事儿 网页版 转发于2015-07-18 15:01
我们对收货地址中自动“发现”的POI做过类似的尝试,对于具有品类特征的POI(如:好再来牛肉拉面馆,西溪印象城)判别效果还不错,但是对于罕见的POI效果就不那么理想,如:四季风情,是什么呢?小区?饭店?理发店?




IT技术博客大学习   网页版 2015-07-18 14:14
算法 应用 推荐系统
【基于综合兴趣度的协同过滤推荐算法】 1 概述 电子商务推荐系统最大的优点在于它能收集用户的兴趣资料和个人信息,根据用户兴趣偏好主动为用户做出个性化推荐。推荐技术指的是如何找出用户感兴趣的商品并列出推荐清单,在用户信息获取差别不大… 详见:http://t.cn/zjoCH07







36氪NEXT   网页版 2015-07-18 12:40
算法 自然语言处理 新闻
「index.co」: http://t.cn/RLfp8zJ 一个全新的科技资讯聚合平台,通过算法和自然语言处理抓取最热的科技新闻,并用数据化的结构展示。目前处于 beta 测试版,NEXT 君友情提醒,申请内测要手快哟~







InfoQ   网页版 2015-07-18 12:23
会议活动 应用 会议 推荐系统
#ArchSummit 2015 全球架构师峰会# 7月18日,ArchSummit 2015 全球架构师峰会第二天进行时,“电商和零售业的转型”专题会场 ,京东推荐搜索部技术总监 刘尚堃带来《京东数据驱动下的个性化推荐系统》精彩专题演讲,演讲内容已经分享至网盘,欢迎点击下载[微笑];http://t.cn/RLfN1xz







bitslife   网页版 2015-07-18 11:56
算法 资源 课程 视频
Algorithms for DNA Sequencing Course 课程http://t.cn/RLfCME9, 干货多多, Youtube 上可以看到全部的视频 http://t.cn/RLfCMEp, 内容设计到了: DNA 测序、字符串、索引、Hash等多种基础算法、拼装等内容, 国内应该多点这种类型的生物信息教育视频,加上实战演习视频会更妙,相信会有人做的。







刘知远THU   网页版 2015-07-18 10:45
会议活动 自然语言处理 活动
7月30日上午10:30在清华大学FIT大楼1-312,实验室邀请了NLP著名学者、Google研究员Slav Petrov做主题为Towards Universal Syntactic Processing of Natural Language的学术报告,敬请关注。[微笑] @刘洋THU @好东西传送门





刘洋THU 网页版 转发于2015-07-18 11:32
Slav Petrov(主页:http://t.cn/RLf9ZYV)是著名的伯克利句法分析器(Berkeley Parser)的开发者,获得过ACL 2011和NAACL 2012最佳论文奖。欢迎大家参加!




九章算法   网页版 2015-07-18 08:50
公告板 问题
#动态规划十问十答# 从来都搞不懂什么是动态规划?动态规划学习有什么捷径?有哪些DP学习资料推荐的?动态规划大总结,绝对不能错过!http://t.cn/RLfxhaQ






好东西传送门   网页版 2015-07-18 08:41
语音 自然语言处理 语言学
NLP日报 2015-07-17 http://t.cn/RLfMTxu 1) IBM推出可分析语气的Watson Tone Analyzer 2) Science文章: 自然语言处理最新进展 3) 统计方法在语言学分支领域的应用 4) 语音识别技术的最新进展 完整版11条 http://t.cn/RLfMTxm







好东西传送门   网页版 2015-07-18 08:39
视觉 简报 雷欣
机器学习日报 2015-07-17 http://t.cn/RLfMNga 1) Science主题:Artificial Intelligence 2) 结合Clarifai和Algolia做自动图像索引 3) 雷欣:如何构建软硬结合的人工智能产品研发体系 4) Science 文章:机器学习前瞻 5) 曾炼:人工智能到底能为我们带来什么? 完整版26条http://t.cn/RLfMNgX







爱可可-爱生活   网页版 2015-07-18 05:37
Matt Mazur
【手把手反向传播实例】《A Step by Step Backpropagation Example》by Matt Mazurhttp://t.cn/RLf5rVC







西瓜大丸子汤   网页版 2015-07-18 01:38
应用 自然语言处理 机器人
《金童软件(摘要)》 http://t.cn/RLf4wEC 看到一家用语义技术做智能聊天机器人的公司。值得关注。








回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|Vision And Learning SEminar

GMT+8, 2024-5-2 22:21 , Processed in 0.021608 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表