机器学习日报 2015-08-24 机器学习在威胁情报中的应用;李航博士的讲座; (Data Scientist) 的...
机器学习日报 2015-08-24[*]Text by the Bay 2015 视频+幻灯片: 文本分析的黄金时代 @iB37
[*]机器学习在威胁情报中的应用 @91Ri_我的安全攻防指南
[*]CCIR2015 李航博士的讲座抢鲜版 @蒋振超
[*]几种典型的Streaming Algorithms介绍 @DataScientist
[*]数据科学家 (Data Scientist) 的核心技能是什么? @phunter_lau
@好东西传送门 出品, 过往目录 见http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报
邮件版包括20条,本期的Web版有完整内容32条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页链接 2015-08-24 22:36
深度学习 算法 资源 自然语言处理 幻灯片 神经网络
#深度干货# NLP创业公司: Text by the Bay 2015, 视频+幻灯片. 文本分析的黄金时代。大数据的标注质量。神经词嵌入 文档向量 深度NLP。学习百万实体的语义。链接数据中的知识发现。提升AirBnb评论真诚性。教机器阅读。基因组分析。关系抽取。话题社会网络。http://t.cn/RLsuu8f 还有Scala和大数据
http://ww4.sinaimg.cn/large/972a1170gw1eve2v3mrizj211y0e6tc4.jpg
http://tp1.sinaimg.cn/2882426600/50/40060484769/1 91Ri_我的安全攻防指南 网页链接 2015-08-24 22:16
资源 董靖 幻灯片
这是一篇特别的文章,当然也可以说它不是文章,它就是一个P!P!T!分享来自思睿嘉得信息技术有限公司CEO董靖的《机器学习在威胁情报中的应用》PPT:http://t.cn/RLsUw99
http://ww2.sinaimg.cn/large/abce56e8jw1eve2asndqfj20zk0k00td.jpg
http://tp4.sinaimg.cn/1916226047/50/5731480380/1 蒋振超 网页链接 2015-08-24 16:03
李航
#CCIR2015# 李航博士的讲座抢鲜版,给博士点赞[赞][赞]
http://ww4.sinaimg.cn/large/723749ffjw1evdri118fcj20hs7so4lq.jpg
http://tp3.sinaimg.cn/1700051610/50/5614246794/1 DataScientist 网页链接 2015-08-24 10:27
经验总结 算法 KNN 博客 聚类
几种典型的Streaming Algorithms介绍:hashing, sketching, hyper log log, count min sketch, streaming k-means, and quantiles via t-digest http://t.cn/RLscmP1
http://tp4.sinaimg.cn/1770891687/50/40086373345/1 phunter_lau 网页链接 2015-08-24 01:08
数据科学
相比楼上楼下的Excel类烂答案和普通答案,这个说的是根本正确。【数据科学家 (Data Scientist) 的核心技能是什么?】@刘亦胖丁生:对数据有极端敏锐的直觉,对数据背后的本质有天才般的认知。 对业务、问题、理论知识拥有科学家一般的洞察力和深入的理解。 http://t.cn/RLsAtR2(分享自 @知乎)
最新动态
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页链接 2015-08-24 23:42
会议活动 算法 自然语言处理 EMNLP 会议 教育网站 神经网络
自然语言推理(文本蕴含)大规模标注数据集,57万对<蕴含 矛盾 中立> A large annotated corpus for learning natural language inference 这种工作以后做文本蕴含的都会引用吧 也都要在这个数据集上跑跑. 数据量变大 使得训练神经网络模型首次达到竞争性的结果 http://t.cn/RLsBGqS
http://ww4.sinaimg.cn/large/972a1170gw1eve4s06ai8j219w0go7b1.jpg
http://tp4.sinaimg.cn/1638782947/50/5710057679/1 新浪财经 网页链接 2015-08-24 21:50
应用 机器人
【这一次“截然不同”】硅谷企业家,《机器人时代》作者马丁福特做客新浪财经《与世界对话》时谈及自动化,智能化,表示这一次的机器人时代不会像我们想象或者希望的那样,即使一些工作被淘汰,但会有更多的工作被创造出来以满足新时代新的创新。观看视频请戳: http://t.cn/RLelSMJ
http://ww2.sinaimg.cn/large/61add7e3jw1eve1k8a1rnj20a005mjsd.jpg
自动化网官方微博 网页链接 转发于2015-08-24 23:23
马丁福特,硅谷企业家,机器人革命,人工智能,工作自动化领域一流专家,在计算机设计和软件开发领域拥有丰富的实践经验,著有《未来之光》和《机器人时代》。#机器人自动化#
http://tp2.sinaimg.cn/2138756037/50/5637975285/1 自动化学报 网页链接 2015-08-24 18:07
视觉 Gui Zhen-Wen Peng Xin Wu Ting 桂振文 彭欣
论文:GUI Zhen-Wen, WU Ting, PENG Xin. A Novel Recognition Approach for Mobile Image Fusing Inertial Sensors. Acta Automatica Sinica, 2015, 41(8): 1394-1404 (桂振文, 吴侹, 彭欣. 一种融合多传感器信息的移动图像识别方法. 自动化学报, 2015, 41(8): 1394-1404) http://t.cn/RLsl8hN
http://tp2.sinaimg.cn/2138756037/50/5637975285/1 自动化学报 网页链接 2015-08-24 18:07
算法 Feng Xiang-Chu Li Xiao-Ping Wang Si-Qi Wang Wei-Wei 冯象初 聚类 王斯琪 王卫卫
综述:WANG Wei-Wei, LI Xiao-Ping, FENG Xiang-Chu, WANG Si-Qi. A Survey on Sparse Subspace Clustering. Acta Automatica Sinica, 2015, 41(8): 1373-1384 (王卫卫, 李小平, 冯象初, 王斯琪. 稀疏子空间聚类综述. 自动化学报, 2015, 41(8): 1373-1384) http://t.cn/RLslHY1
http://tp2.sinaimg.cn/3227020453/50/5656309782/1 自动化网官方微博 网页链接 2015-08-24 14:07
应用 机器人
【快递机器人 VS 亚马逊无人机】据英国《每日邮报》报道,以色列申卡尔工程设计学院工程设计系的学生科比•西卡(Kobi Shikar)构思出一种新型的Transwheel机器人,它能快速方便将包裹送到我们的门口。据悉这种机器人能用机器手臂搬运货物,靠单排轮电动平衡车行驶。http://t.cn/RLsa3NJ
http://ww4.sinaimg.cn/large/c0586ca5jw1evdo5urkkfj20cy08ct8q.jpg
http://tp2.sinaimg.cn/1863292633/50/5680510352/0 中国电子报社 网页链接 2015-08-24 13:41
自然语言处理 陆奇 问答系统
【微软进入情感计算时代】近日微软在北京亚太研发集团发布第三代人工智能的产品“小冰”,全球执行副总裁陆奇表示,小冰是微软历史非常特殊也不同寻常的小孩,它真正从底层的架构上实现了突破,标志着微软进入“情感计算时代”,“小冰三”对整个人工智能行业都将具有重大的意义。http://t.cn/RLsXQy4
http://tp1.sinaimg.cn/3769368692/50/5730530271/1 格灵深瞳 网页链接 2015-08-24 13:36
深度学习 算法 神经网络
【IBM 神经元芯片 TrueNorth 要跑深度神经网络了】http://t.cn/RLDMD9A TrueNorth 是首个基于 SyNAPSE 打造的芯片,该芯片内置 100 万个模拟神经元和 2.56 亿个模拟神经突触。不同芯片可以通过阵列的方式互联。据称 48 颗芯片组建成的具有 4800 万个神经元的网络,智力水平已经和普通老鼠大脑差不多。
http://ww4.sinaimg.cn/large/e0ac0074gw1evdna33zk7j20go0ca74h.jpg
http://tp1.sinaimg.cn/2396229572/50/5611015099/1 CCF中文信息技术专委会 网页链接 2015-08-24 10:45
会议活动 资源 自然语言处理 NLPCC 会议 课程
NLPCC 2015开放会议注册啦,欢迎注册参会!会议通知见CCF网站:http://t.cn/RLsVpUQ。ADL59/NLPCC Tutorials(http://t.cn/RLsVpUH)将与学术大会(Conference)同期举办。NLPCC21015提前注册9月10日截止,同时注册ADL和NLPCC将享受更多优惠,请登录NLPCC2015会议网站注册缴费:http://t.cn/RLsVpUT
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-08-24 08:12
深度学习 算法 语音 Al Maas Python 代码 教育网站 神经网络
【论文+代码(Python):基于深度网络的end-to-end对话语音识别】《Lexicon-Free Conversational Speech Recognition with Neural Networks》AL Maas, Z Xie, D Jurafsky, AY Ng (NAACL2015) http://t.cn/RLsbcRpcode(CTC + DBRNN):http://t.cn/RLsbcRC code(Character LM):http://t.cn/RLsbcRN
http://ww1.sinaimg.cn/large/5396ee05gw1evddug8or7j20bf06sgm6.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-08-24 07:15
深度学习 自然语言处理 简报
第339期机器学习日报(2015-08-23)http://t.cn/RLsUnuU 1) Stanford自然语言推理(SNLI)数据集 2) Stanford NLP Group Topic 3) RNN 直接在字符级做序列预测 4) Variational autoencoder 5) 公开推荐论文的网站Recommend-Paper.org 完整版22条 http://t.cn/RLsUnuy
http://ww2.sinaimg.cn/large/005HjjGQgw1evdc97ixlij307s05at91.jpg
http://tp2.sinaimg.cn/1932835417/50/5714878873/1 西瓜大丸子汤 网页链接 2015-08-24 07:05
自然语言处理
什么是语义?语义就是结构。为什么要有结构?可以从已知的关系推导出未知的关系。数据库从已知的表生成未知的表,这就是结构和语义。形式语言里,不同的表达式可以表示一个意思,不同的程序可以完成一样的操作,这是表达式的语义。自然语言的语义可以用表达式来近似。这些都是超越字面上lexical的表示
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-08-24 06:55
深度学习 算法 Python 代码 神经网络 统计
【论文+代码(C/Theano):面向深度网络可扩展贝叶斯推理的概率反向传播(PBP)算法】《Probabilistic Backpropagation for Scalable Learning of Bayesian Neural Networks》JM Hernández-Lobato, RP Adams (2015) code:http://t.cn/RAGB7QH
爱可可-爱生活 网页链接 转发于2015-08-24 07:01
arXiv:http://t.cn/RAG1yhV 参阅"(Harvard)HIPS将发布可扩展/自动调参贝叶斯推理神经网络Proba. Back Prop(PBP)":http://weibo.com/1402400261/CqpDxgNTK
http://icon.memect.com/http://blog.csdn.net/neomanontheway/article/details/47910089 csdn:NeomanOntheway 网页链接 2015-08-24 04:50
经验总结 算法 应用 博客 矩阵 推荐系统 信息检索
【实现起来还是比较方便快捷的,这里rmse是用来评测效果的】其实一开始是比较疑惑的,因为一开始没有查看论文,只是网上搜了一下svd的概念和用法,搜到的很多都是如下的公式: 其中假设C是m*n的话,那么可以得到三个分解后的矩阵,分别为m*r,r*r,r*n,这样的话就可以大大降低存储代价,但是这里特别需要注意的是:这个概念一开始是用于信息检索方面的,它的C矩阵式完整的,故他们可以直接把这个矩阵应用svd分解,但是在推荐系统... http://memect.co/2ueO79XW9UV
http://img.blog.csdn.net/20150216104712075
http://tp3.sinaimg.cn/1239003334/50/40036350595/1 北海vincent 网页链接 2015-08-24 00:40
自然语言处理
现在数据治理越发受到重视,政府高层都天天讲数据孤岛问题,各部门也都有科研基金来解决系统内部的数据互联互通问题。互联网数据治理的核心问题是信息抽取的问题,现有的文本抽取技术远不能实用,网页抽取技术也难以做到大规模抽取。我们希望网页抽取方面占得先机。
http://tp3.sinaimg.cn/1239003334/50/40036350595/1 北海vincent 网页链接 2015-08-24 00:27
知识工程 自然语言处理 语义网
解决数据孤岛的问题,目前最好的方法还是基于语义网和本体论的。虽然企业拥抱语义网的动力不大,但在大数据时代,为解决数据孤岛问题而出现的第三方语义网镜像却有可能出现。通过信息抽取技术为传统网站建立语义网镜像从而解决数据孤岛问题,这是数据治理的范畴。
页:
[1]