解应春BW 发表于 2015-9-8 10:57:17

机器学习日报 2015-09-07 Depth-Gated LSTM;监督学习框架DL-Learner;minhash和simhash

机器学习日报 2015-09-07
[*]OWL/RDF/描述逻辑的监督学习框架DL-Learner @爱可可-爱生活
[*]Differential Topic Models @iB37
[*]Depth-Gated LSTM @爱可可-爱生活
[*]minhash和simhash的比较 @龙星镖局
[*]Text Understanding from Scratch @iB37

@好东西传送门 出品, 过往目录 见http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

邮件版包括20条,本期的Web版有完整内容31条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-09-07 14:08
深度学习 知识工程 代码 语义网
【开源:面向OWL/RDF/描述逻辑的监督学习框架DL-Learner】"a framework for supervised Machine Learning in OWL, RDF and Description Logics" http://t.cn/Ryy8JfS Github:http://t.cn/Ryy8Jfa


昊奋 网页链接 转发于2015-09-07 14:12
学习描述逻辑公理的,公理类似规则用来做逻辑推理



http://tp1.sinaimg.cn/2536116592/50/5716095299/0 iB37 网页链接 2015-09-07 22:08
会议活动 自然语言处理 NIPS 会议 教育网站 统计 主题模型
比较文本挖掘或者交叉文档集建模中,不同的文档集有共性,也有个性。Differential Topic Models 提出层次贝叶斯非参模型,用Pitman-Yor过程建模话题-词分布中的幂律/长尾现象,针对新模型的先验和似然不共轭提出了新的高效采样法 http://t.cn/RyUZbDV 注:NIPS15有很多贝叶斯相关的
http://ww4.sinaimg.cn/large/972a1170gw1evu8qn6iiwj21de0fctcf.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-09-07 21:43
深度学习 代码 论文
【论文+代码(c++):Depth-Gated LSTM(DGLSTM)】《Depth-Gated LSTM》K Yao, T Cohn, K Vylomova, K Duh, C Dyer (2015) http://t.cn/RLg4shDGitHub(dglstm.h+dglstm.cc):https://github.com/kaishengyao/cnn/tree/master/cnn
http://ww1.sinaimg.cn/large/5396ee05gw1evu7zorrizj20ez09l75u.jpg



http://tp4.sinaimg.cn/1830516311/50/40056293723/1 龙星镖局 网页链接 2015-09-07 16:32
资源 自然语言处理 PDF 期刊
这篇文章很有意思,作者理论和实验都证明了对于binary data,minhash比simhash要牛掰一点。http://t.cn/RvWmO9W 话说谁能用一两句说清什么场景用哪个么?
http://ww1.sinaimg.cn/large/6d1b7657gw1evtyyolgudj20sk08cab8.jpg

龙星镖局 网页链接 转发于2015-09-07 17:11
回复@yuzzzzzzzzz: 赞 是这篇 Asymmetric LSH (ALSH) for Sublinear Time Maximum Inner Product Search (MIPS) http://t.cn/RyyBQGI



http://tp1.sinaimg.cn/2536116592/50/5716095299/0 iB37 网页链接 2015-09-07 08:15
会议活动 深度学习 算法 NIPS 分类 会议
Text Understanding from Scratch 已被NIPS15录取,标题改为Character-level Convolutional Networks for Text Classification,增加了第二作者。文章、代码和数据集 http://t.cn/RyySITA
http://ww1.sinaimg.cn/large/972a1170gw1evtknxtm8wj21d60etn0k.jpg



最新动态
http://tp4.sinaimg.cn/1830516311/50/40056293723/1 龙星镖局 网页链接 2015-09-07 17:46
算法 矩阵
国内可能打不开的这个页面http://t.cn/a1FJwZ ,列举很有用的矩阵分解的资料,居家旅行必备之良药啊,转存了一份到我爱计算机。 The Advanced Matrix Factorization Jungle | 我爱计算机 http://t.cn/RyydAsM




http://tp1.sinaimg.cn/3514363544/50/22869369519/0 MOOC学院 网页链接 2015-09-07 15:19
算法 资源 课程 林轩 林轩田
【机器学习进阶课程来了!】不满足于掌握机器学习的常用算法,想进一步了解其中的原理?来挑战台大林轩田老师的《机器学习基石》吧!课程兼顾理论讲解与实践操作,告诉你机器为什么能够学习,并与你探讨如何让机器学得更好,MOOC学院网友9.2分好评,明天开课:http://t.cn/8DDW7VN #MOOC新课#
http://ww2.sinaimg.cn/large/d178ee98gw1evtwv99wa4j20zk0k0gp9.jpg



http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2015-09-07 13:40
深度学习 算法 自然语言处理 Python Van Merrienboer 代码 机器翻译 论文 神经网络 统计
【论文+实现(Python):面向统计机器翻译的RNN短语向量】《Learning phrase representations using rnn encoder-decoder for statistical machine translation》K Cho, B Van Merriënboer, C Gulcehre (2014)http://t.cn/RyyQhC0 GitHub("Neural Machine Translation"):http://t.cn/RyyQhCO
http://ww1.sinaimg.cn/large/5396ee05gw1evtu0s6rflj208i08g74r.jpg



http://tp1.sinaimg.cn/2536116592/50/5716095299/0 iB37 网页链接 2015-09-07 13:12
深度学习 Geoffrey Hinton Summer Students 教育网站
Hinton (1947—)不带学生了: "I will not be taking any more graduate students, visiting students, summer students or visitors, so please do not apply to work with me." http://t.cn/7MAH5 最近的两篇一作文章: 知识蒸馏Distilling knowledge in NN 特征从哪来Where do features come from
http://ww1.sinaimg.cn/large/972a1170gw1evtt5gdw22j20ra0pmjwj.jpg



http://tp4.sinaimg.cn/1758081527/50/5720173426/1 数急 网页链接 2015-09-07 12:43
算法 统计 主题模型
#LDA算法漫游指南# E-L方程和拉格朗日乘数法联合使用可以发挥更强大的能力,该方法备受我国的钱三强推崇,这种方法后来在有限元方法、以及在超音速飞机机翼的设计中都有广泛应用。在变分贝叶斯方法中,这个技术用在了最后核心的一步一剑封喉!




http://tp3.sinaimg.cn/5648620342/50/5731472374/1 闫安Jon 网页链接 2015-09-07 11:07
深度学习 算法 论文 强化学习 神经网络
Giraffe: Using Deep Reinforcement Learning to Play Chess http://t.cn/Ryy0utI 用两隐藏层的神经网络处理基本棋盘特征,再用所得概率限制搜索树。这是作者为满足硕士学位要求所做项目,在普通PC上已达国际象棋大师水准。如果更多资源投入到类似研究上,攻克围棋还会远吗?
http://ww1.sinaimg.cn/large/006ah2bIjw1evtph2m5jlj30i50gstaf.jpg



http://tp3.sinaimg.cn/2640510102/50/40024857075/1 GPUS-雷帝 网页链接 2015-09-07 10:52
深度学习 GPU
#GPU世界论坛# 感谢您关注CUDA开发者系列培训之五 -- GPU加速深度学习! 本次培训仍采用学员先通过录制的培训内容自学习,收集学习中的问题,再上线参加线上培训及答疑的方式,以确保更好的学习效率及照顾学员各自的时间安排。http://t.cn/Ryy070X




http://tp1.sinaimg.cn/1741045432/50/5602490826/1 CSDN云计算 网页链接 2015-09-07 10:15
深度学习 算法 神经网络
【递归神经网络不可思议的有效性】递归神经网络有一些不可思议的地方,有些时候,模型与你期望的相差甚远,许多人认为是RNNS非常难训练,那么RNNs究竟是什么呢?就有这篇文章来带给大家。http://t.cn/Ry2LwKY
http://ww3.sinaimg.cn/large/67c63eb8gw1evto56zev1j20go08eabj.jpg



http://tp1.sinaimg.cn/2536116592/50/5716095299/0 iB37 网页链接 2015-09-07 09:12
会议活动 深度学习 算法 ICLR NIPS 会议 论文
Zhang等ICLR15论文DEEP LEARNING WITH ELASTIC AVERAGING SGD被NIPS15录取,增加对比ADMM. 基于弹性力将本地工作器的参数与中央参数服务器的变量联系起来,通过减少本地和中央的通信允许本地工作器的局部变量相对于中心变量有较大波动,这种探索策略适合于有很多局部最优的深度学习 http://t.cn/RAeoOrE
http://ww1.sinaimg.cn/large/972a1170gw1evtmauwsuoj216d0rjah6.jpg



http://tp2.sinaimg.cn/1932835417/50/5714878873/1 西瓜大丸子汤 网页链接 2015-09-07 08:31
知识工程 行业动态 知识库
知识图谱当然是个系统工程,很大很大。谷歌的组有上千人了。但是这并不是说,知识图谱的不可复制性是由于它的大。其实大反而是劣势,这么大的预算,那些“小”的市场是VP和PM们不感兴趣的。但是成长起来,其实是需要从那些不起眼的,只有几万人几十万人的市场做起。知识图谱最后的发展,要靠小公司。




http://tp4.sinaimg.cn/1497035431/50/5729579491/1 梁斌penny 网页链接 2015-09-07 08:29
应用 陈彧堃 推荐系统
友盟前军事领导人,创始人,杰出的我清校友陈彧堃同志,创办了新公司newsdog,在pennyjob发布重要招聘广告,招聘杰出爬虫工程师,推荐系统工程师等。欢迎广大知识青年考虑,谢谢。 http://t.cn/RyySmV7




http://tp1.sinaimg.cn/1646218964/50/1279883225/1 IT技术博客大学习 网页链接 2015-09-07 08:14
应用 推荐系统
【国内外旅游电子商务个性化推荐系统研究】 随着信息技术和电子商务技术的飞速发展以及互联网的普及,电子商务网站层出不穷。由于旅游产品本身具有无形性、不可储藏和非物质性等特点,并且不存在物流配送问题,使得旅游电子商务更容易运作。例如,... 详见:http://t.cn/zjoC6aV




http://tp2.sinaimg.cn/1932835417/50/5714878873/1 西瓜大丸子汤 网页链接 2015-09-07 07:44
知识工程 知识库
说“技术没有不可复制性”的,可以参考一下Google在语义技术上的投入。2006年google就开始投入做这个方向,一直摸不清楚该怎么做,先后n个失败。一直到了2010年收购Metaweb (Freebase)才开始明白知识系统建模的要点。以后大批招本领域的牛人,又消化了两年才推出知识图谱。


西瓜大丸子汤 网页链接 转发于2015-09-07 07:51
技术驱动型的初创企业,他们真正的竞争优势,都是教科书里找不到的。很多踩过的坑,都是圈子里的小秘密,可能全世界也就几十个人知道。这种技术,哪里有这么容易复制?

西瓜大丸子汤 网页链接 转发于2015-09-07 07:55回复 @西瓜大丸子汤 “技术驱动型的初创企业,他们真正...”
而且大公司都有自己的技术基因。DNA不匹配的新技术在他们里面发展起来,其实是很不容易的。所谓的“创新者的窘境”

玄了个澄的 网页链接 转发于2015-09-07 07:56回复 @西瓜大丸子汤 “技术驱动型的初创企业,他们真正...”
所以,当我们没有遇到真正困难的问题之前,就不能说抓到了真正的机会

ubernetes 网页链接 转发于2015-09-07 08:12回复 @西瓜大丸子汤 “技术驱动型的初创企业真正的竞争...”
Any single point of technology is easy to copy. Search Engine, Knowledge Graph, Cloud ... are not, b/c they're massive system engineering.

西瓜大丸子汤 网页链接 转发于2015-09-07 08:23回复 @ubernetes “Any single point of technology...”
大公司不去做并不是因为那些技术大,而往往恰恰是因为那些技术小。小规模和大规模技术在文化上就不一样。

孙明明_SmarterChina 网页链接 转发于2015-09-07 12:40
Google在知识图谱方向非常保守



http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-09-07 07:40
深度学习 算法 自然语言处理 PCA 简报 统计 主题模型
第353期机器学习日报(2015-09-06)http://t.cn/Ryyaimp 1) 硕士论文: word2vec+CNN做面向QA的句子多标签分类 2) LDA是概率PCA的离散化和离散ICA 3) 详细解释数据挖掘中的 10 大算法 4) 基于张量方法的词典学习 5) 免费书:贝叶斯推理与机器学习 完整版25条 http://t.cn/Ryyaim0
http://ww3.sinaimg.cn/large/005HjjGQgw1evtjnkors2j30j607oaav.jpg



http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页链接 2015-09-07 07:36
应用 自然语言处理 Python 机器人
第321期Python日报(2015-09-06)http://t.cn/RyyafSD 1) 用于创建图形用户界面的Python工具包: Flexx 2) Python下基于Chainer的neural art实现Stylenet 3) 用AIML开发人工智能聊天机器人 4) Mac OS X上的IPython前端: Pineapple 5) 基于Webpy实现服务器策略模型 完整版11条 http://t.cn/RyyafSk
http://ww4.sinaimg.cn/large/005HjjGQgw1evtjjs6annj30jx09ldg5.jpg




页: [1]
查看完整版本: 机器学习日报 2015-09-07 Depth-Gated LSTM;监督学习框架DL-Learner;minhash和simhash