VALSE

查看: 7063|回复: 0

机器学习日报 2017-07-25 DeepMind最新ICML论文:价值分布方法超越所有传统强化学习

[复制链接]

829

主题

837

帖子

7万

积分

版主

Rank: 7Rank: 7Rank: 7

积分
79326
QQ
发表于 2017-7-30 08:31:35 | 显示全部楼层 |阅读模式
机器学习日报 2017-07-25
@好东西传送门 出品,由@AI100运营, 过往目录http://ml.memect.com


订阅:关注微信公众号 AI100(ID:rgznai100,扫二维码),回复“机器学习日报”,加你进日报群

邮件版包括15条,本期的Web版有完整内容16条

用日报搜索找到以前分享的内容: http://ml.memect.com/search/
今日焦点 (5)
wx:新智元   网页链接 2017-07-25 15:01
会议活动 深度学习 算法 ICML 会议 强化学习
「DeepMind最新ICML论文:价值分布方法超越所有传统强化学习」价值分布方法让 RL 系统更准确,训练更快,启发重新思考强化学习。 http://hao.memect.cn/15r




爱可可-爱生活   网页链接 2017-07-25 21:01
代码
【机器学习标准数据集加载工具】’Observations - Tools for loading standard data sets in machine learning' by edwardlib GitHub: http://t.cn/R97mVI8




wx:人工智能学家   网页链接 2017-07-25 15:02
深度学习 算法
「DeepMind新论文:在复杂环境中,智能体能更聪明地进行想象和思考了」如果想让算法也能执行同样复杂的行为,那么这种算法也必须和人一样,对未来具有想象和推理能力。 http://hao.memect.cn/15w




wx:全球人工智能   网页链接 2017-07-25 15:01
自然语言处理
「资源 | 斯坦福发布Stanford.NLP.NET多个NLP工具」该项目包含使用使用 IKVM.NET 将 Stanford NLP.jar 软件包重新编译到.NET 中的构 http://hao.memect.cn/15o




爱可可-爱生活   网页链接 2017-07-25 06:36
算法 应用 Alpha Pdf Jose Miguel Hernandez 代码 强化学习 神经网络 数据科学 统计 信息检索
【随机输入贝叶斯神经网络模型增强学习】《Bayesian Neural Networks with Random Inputs for Model Based Reinforcement Learning》by José Miguel Hernández Lobato http://t.cn/R9PjJVK GitHub:http://t.cn/R9PjJV9pdf:http://t.cn/R9PjJVN ref:《Learning and Policy Search in Stochastic Dynami...全文: http://m.weibo.cn/1402400261/4133286521621348




最新动态
爱可可-爱生活   网页链接 2017-07-25 20:57
会议活动 深度学习 算法 自然语言处理 CRF EMNLP 代码 会议
“(Keras)BiLSTM-CNN-CRF Implementation for Sequence Tagging” by UKPLab GitHub:http://t.cn/R97np5I ref:《Reporting Score Distributions Makes a Difference: Performance Study of LSTM-networks for Sequence Tagging》(2017) ​




微软亚洲研究院   网页链接 2017-07-25 19:00
应用 David Molnar 安全
【人工智能检测软件安全风险】面对系统错误、崩溃和恶意攻击等一系列麻烦,保护系统免受攻击成为软件开发者们关注的重点。日益增加的需要测试的软件数量让安全专家们越来越力不从心,而微软正在开发一种云服务,开发者可以利用它既快又准地识别出即将发布或已投入使用的软件中的错误和其它安全漏洞。 ...全文: http://m.weibo.cn/1286528122/4133473788214730


微软亚洲研究院 网页链接 转发于2017-07-25 19:00
微软安全风险检测团队负责人David Molnar表示,该工具能够极大地帮助那些正在经历大规模数字化转型的公司,以及那些将新技术纳入到以往纯凭手工完成或仅使用初级技术的业务流程中。这些公司的员工可能是各自核心业务领域内的世界级专家,但他们未必有专职人员对即将使用的新软件进行复杂的安全测试。



ArnetMiner   网页链接 2017-07-25 18:39
深度学习 算法 资源 PDF 论文 强化学习
【Deepmind新论文二篇】《Imagination-Augmented Agents for Deep Reinforcement Learning》http://t.cn/R97Stea 《Learning model-based planning from scratch》 http://t.cn/R97SteS 在基于复杂环境的深度增强学习中加入想象和计划 ​




专注云计算   网页链接 2017-07-25 18:06
深度学习
【DeepMind新论文:在复杂环境中,智能体能更聪明地进行想象和思考了】不同于AlphaGo所处的“完美环境”,在复杂和不完美的环境中,智能体能高效地思考,对未来的结果进行想象吗?DeepMind推出新论文,描述了一类基于想象来进行计划的新方法,http://t.cn/R97Mmya




冯志伟文化博客   网页链接 2017-07-25 17:56
经验总结 自然语言处理 博客 秦陇纪
发表了博文《文本词向量Word2Vec模型》文本词向量Word2Vec模型原创2017-07-01秦陇纪10汇编数据简化DataSimp目录一、文本词向量Word2Vec模型(3210字)1前言1Wohttp://t.cn/R97IWif




wx:机器之心   网页链接 2017-07-25 15:03
算法 SVM 张腾 周志华
「学界 | 代替支持向量机,南大周志华组提出多类最优边界分配机mcODM」南京大学机器学习与数据挖掘研究所张腾与周志华的新研究提出了在多类分类问题上的全新解决方法——mcODM http://hao.memect.cn/162




wx:新智元   网页链接 2017-07-25 15:01
会议活动 视觉 CVPR 会议 林达华
「【商汤科技23篇论文横扫CVPR】林达华教授重磅揭秘冠军论文」香港中大林达华教授亲自精选五篇得奖论文与大家分享。这五篇论文的研究成果在各个专业数据集、竞赛如ImageNet、Visual Genome、DAVIS Challenge、MPII中,取得第一名的成绩。 http://hao.memect.cn/15q




ChatbotsChina   网页链接 2017-07-25 14:00
最佳AI /机器学习资源索引 http://t.cn/R9hpMVG




专注云计算   网页链接 2017-07-25 11:13
会议活动 视觉 CVPR 行业动态 会议
【谷歌官方:CVPR最强总结:5位主席21篇论文,最关注数据】CVPR 2017,作为会议的白金赞助商,谷歌表现强势,有超过 250 人参会,并且有 21 篇论文被接收。一起来看看。根据谷歌官方的数据,这次 CVPR 2017 共有 21 篇文章被接收。这些论文覆盖的方向也很广,从技术到应用到理论都有。...全文: http://m.weibo.cn/1750765385/4133356235587966




ChatbotsChina   网页链接 2017-07-25 10:17
深度学习 杨强
香港科技大学杨强教授:深度学习如何才能更靠谱? http://t.cn/R9PC09d





回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|Vision And Learning SEminar

GMT+8, 2024-12-22 15:09 , Processed in 0.020463 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表