机器学习日报 2017-07-25 DeepMind最新ICML论文：价值分布方法超越所有传统强化学习

解应春BW · 发表于 2017-7-30 08:31:35

机器学习日报 2017-07-25

DeepMind最新ICML论文：价值分布方法超越所有传统强化学习 @wx:新智元
机器学习标准数据集加载工具 @爱可可-爱生活
DeepMind新论文：在复杂环境中，智能体能更聪明地进行想象和思考 @wx:人工智能学家
斯坦福发布Stanford.NLP.NET多个NLP工具 @wx:全球人工智能
全新强化学习算法，看贝叶斯神经网络如何进行策略搜索 @爱可可-爱生活

@好东西传送门出品,由@AI100运营， 过往目录 见http://ml.memect.com

订阅：关注微信公众号 AI100（ID：rgznai100，扫二维码），回复“机器学习日报”，加你进日报群

邮件版包括15条，本期的Web版有完整内容16条

用日报搜索找到以前分享的内容： http://ml.memect.com/search/

今日焦点 (5)

wx:新智元 网页链接 2017-07-25 15:01
会议活动深度学习算法 ICML 会议强化学习
「DeepMind最新ICML论文：价值分布方法超越所有传统强化学习」价值分布方法让 RL 系统更准确，训练更快，启发重新思考强化学习。 http://hao.memect.cn/15r

爱可可-爱生活 网页链接 2017-07-25 21:01
代码
【机器学习标准数据集加载工具】’Observations - Tools for loading standard data sets in machine learning' by edwardlib GitHub: http://t.cn/R97mVI8

wx:人工智能学家 网页链接 2017-07-25 15:02
深度学习算法
「DeepMind新论文：在复杂环境中，智能体能更聪明地进行想象和思考了」如果想让算法也能执行同样复杂的行为，那么这种算法也必须和人一样，对未来具有想象和推理能力。 http://hao.memect.cn/15w

wx:全球人工智能 网页链接 2017-07-25 15:01
自然语言处理
「资源 | 斯坦福发布Stanford.NLP.NET多个NLP工具」该项目包含使用使用 IKVM.NET 将 Stanford NLP.jar 软件包重新编译到.NET 中的构 http://hao.memect.cn/15o

爱可可-爱生活 网页链接 2017-07-25 06:36
算法应用 Alpha Pdf Jose Miguel Hernandez 代码强化学习神经网络数据科学统计信息检索
【随机输入贝叶斯神经网络模型增强学习】《Bayesian Neural Networks with Random Inputs for Model Based Reinforcement Learning》by José Miguel Hernández Lobato http://t.cn/R9PjJVK GitHub:http://t.cn/R9PjJV9pdf:http://t.cn/R9PjJVN ref:《Learning and Policy Search in Stochastic Dynami...全文： http://m.weibo.cn/1402400261/4133286521621348

最新动态

爱可可-爱生活 网页链接 2017-07-25 20:57
会议活动深度学习算法自然语言处理 CRF EMNLP 代码会议
“(Keras)BiLSTM-CNN-CRF Implementation for Sequence Tagging” by UKPLab GitHub:http://t.cn/R97np5I ref:《Reporting Score Distributions Makes a Difference: Performance Study of LSTM-networks for Sequence Tagging》(2017)

微软亚洲研究院 网页链接 2017-07-25 19:00
应用 David Molnar 安全
【人工智能检测软件安全风险】面对系统错误、崩溃和恶意攻击等一系列麻烦，保护系统免受攻击成为软件开发者们关注的重点。日益增加的需要测试的软件数量让安全专家们越来越力不从心，而微软正在开发一种云服务，开发者可以利用它既快又准地识别出即将发布或已投入使用的软件中的错误和其它安全漏洞。 ...全文： http://m.weibo.cn/1286528122/4133473788214730

微软亚洲研究院 网页链接转发于2017-07-25 19:00
微软安全风险检测团队负责人David Molnar表示，该工具能够极大地帮助那些正在经历大规模数字化转型的公司，以及那些将新技术纳入到以往纯凭手工完成或仅使用初级技术的业务流程中。这些公司的员工可能是各自核心业务领域内的世界级专家，但他们未必有专职人员对即将使用的新软件进行复杂的安全测试。

ArnetMiner 网页链接 2017-07-25 18:39
深度学习算法资源 PDF 论文强化学习
【Deepmind新论文二篇】《Imagination-Augmented Agents for Deep Reinforcement Learning》http://t.cn/R97Stea 《Learning model-based planning from scratch》 http://t.cn/R97SteS 在基于复杂环境的深度增强学习中加入想象和计划

专注云计算 网页链接 2017-07-25 18:06
深度学习
【DeepMind新论文：在复杂环境中，智能体能更聪明地进行想象和思考了】不同于AlphaGo所处的“完美环境”，在复杂和不完美的环境中，智能体能高效地思考，对未来的结果进行想象吗？DeepMind推出新论文，描述了一类基于想象来进行计划的新方法，http://t.cn/R97Mmya

冯志伟文化博客 网页链接 2017-07-25 17:56
经验总结自然语言处理博客秦陇纪
发表了博文《文本词向量Word2Vec模型》文本词向量Word2Vec模型原创2017-07-01秦陇纪10汇编数据简化DataSimp目录一、文本词向量Word2Vec模型(3210字)1前言1Wohttp://t.cn/R97IWif

wx:机器之心 网页链接 2017-07-25 15:03
算法 SVM 张腾周志华
「学界 | 代替支持向量机，南大周志华组提出多类最优边界分配机mcODM」南京大学机器学习与数据挖掘研究所张腾与周志华的新研究提出了在多类分类问题上的全新解决方法——mcODM http://hao.memect.cn/162

wx:新智元 网页链接 2017-07-25 15:01
会议活动视觉 CVPR 会议林达华
「【商汤科技23篇论文横扫CVPR】林达华教授重磅揭秘冠军论文」香港中大林达华教授亲自精选五篇得奖论文与大家分享。这五篇论文的研究成果在各个专业数据集、竞赛如ImageNet、Visual Genome、DAVIS Challenge、MPII中，取得第一名的成绩。 http://hao.memect.cn/15q

ChatbotsChina 网页链接 2017-07-25 14:00
最佳AI /机器学习资源索引 http://t.cn/R9hpMVG

专注云计算 网页链接 2017-07-25 11:13
会议活动视觉 CVPR 行业动态会议
【谷歌官方：CVPR最强总结：5位主席21篇论文，最关注数据】CVPR 2017，作为会议的白金赞助商，谷歌表现强势，有超过 250 人参会，并且有 21 篇论文被接收。一起来看看。根据谷歌官方的数据，这次 CVPR 2017 共有 21 篇文章被接收。这些论文覆盖的方向也很广，从技术到应用到理论都有。...全文： http://m.weibo.cn/1750765385/4133356235587966

ChatbotsChina 网页链接 2017-07-25 10:17
深度学习杨强
香港科技大学杨强教授：深度学习如何才能更靠谱？ http://t.cn/R9PC09d