机器学习日报 2015-08-13 《计算广告》;预测广告算法的长期效果 ;深度学习暑期学校上的...
机器学习日报 2015-08-13[*]@北冥乘海生 《计算广告》 @龙星镖局
[*]Russ Salakhutdinov在蒙特利尔深度学习暑期学校上的幻灯片 @王威廉
[*]Elasticsearch添加中文分词 @jianfengye110
[*]考虑词序和字符序的神经词嵌入 @iB37
[*]KDD2015 Google:预测广告算法的长期效果 @zwner
@好东西传送门 出品, 过往目录 见http://ml.memect.com
订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报 或点击点我订阅
本期话题有:全部32 算法13 自然语言处理11 应用9 深度学习8 会议活动8 资源6经验总结5 视觉4 语音3
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp4.sinaimg.cn/1830516311/50/40056293723/1 龙星镖局 网页版 2015-08-13 19:17
洪涛 课程 刘鹏 书籍
@北冥乘海生 的著作《计算广告》下月即将开卖,强烈推荐给大家。值得推荐的理由:1)世界第一本关于计算广告的书籍;2)刘鹏老师是该领域理论实践都资深的专家;3)本书是经受考验的《计算广告》课程的升级版;4)本书章节划分清晰,读者可自行选择精读;5)业内30位大家推荐;6)我准备预订两本。
http://ww4.sinaimg.cn/large/6d1b7657gw1ev17bj8guhj20is05mt9n.jpg
龙星镖局 网页版 转发于2015-08-13 19:26
个人觉得洪涛老师@zhazhaba 的打油诗是该书做了很好的总结,难以超越的推荐语。这个书写推荐语和序言的阵容之豪华,令人羡慕不已。如果不是好书,也难请到这些人。比如@余凯_西二旗民工 @张栋_机器学习 @李航博士 @湾区评论 @刘铁岩 @杨伟庆 等等
龙星镖局 网页版 转发于2015-08-13 21:08
客观来说这本书有点小瑕疵:各种技术产品划分有点小乱,个别章节有点小拖沓,没有特别酣畅淋漓的感觉。不过做第一本,确实很难做到十全十美。@北冥乘海生
龙星镖局 网页版 转发于2015-08-13 21:15回复 @unicode-章 “我们已经出版过计算广告的书《互…”
抱歉,这本书更偏技术也更丰富一些。可能要深度了解计算广告,这两本都要买来看看。[可爱]
http://tp4.sinaimg.cn/1657470871/50/5676743531/1 王威廉 网页版 2015-08-13 11:00
深度学习 资源 PDF Russ Salakhutdinov 幻灯片 课程
多伦多大学教授Russ Salakhutdinov在刚刚进行的蒙特利尔深度学习暑期学校上的幻灯片。1http://t.cn/RL3Y2zL 2 http://t.cn/RL3Y2z2 其他课程幻灯片 http://t.cn/RLunrt4
http://tp2.sinaimg.cn/1774036133/50/5614833486/1 jianfengye110 网页版 2015-08-13 09:55
应用 自然语言处理 数据库 信息检索
#技术导读# 为Elasticsearch添加中文分词,对比分词器效果 Elasticsearch中自带的分词器弱爆了,文章给了如何安装IK,并且进行比较 http://t.cn/RzT8nNI
刘鑫Mars 网页版 转发于2015-08-13 09:59
有同行做了一个懒人包,elasticsearch-rtf ,我司用的那个,不过将来可能会用回 PostgreSQL 的 TSearch2 + nlpbamboo
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页版 2015-08-13 09:08
会议活动 算法 自然语言处理 ICML 会议 期刊 神经网络
考虑词序和字符序的神经词嵌入, 在词类比任务尤其是句法任务上效果好。Modeling Order in Neural Word Embeddings at Scale 模型:Partitioned Embedding Neural Network Model (PENN) http://t.cn/RL3NFV3
http://ww1.sinaimg.cn/large/972a1170gw1ev0pm55jzvj21b10gptf5.jpg
http://tp3.sinaimg.cn/1735865350/50/1301056723/1 zwner 网页版 2015-08-13 06:08
算法 资源 PDF
KDD2015上Google有一篇有趣的论文:预测广告算法的长期效果。http://t.cn/RL3aYv9 既然短期效果和长期效果可能不太一致,那就直接建一个线性模型,通过短期效果的指标去预测长期的CTR提升比例。最后的模型考虑的因素很简单:广告的CTR以及登陆页面的质量。
http://ww4.sinaimg.cn/large/67773406gw1ev0kcur1d9j20er04sglx.jpg
phunter_lau 网页版 转发于2015-08-13 07:50
想起来我面Linkedin的时候他们问到类似一个非CTR预测的问题,我建议了类似的外延想法,然后被鄙视了,难怪股价一路跌,欧耶
最新动态
2015-08-13 (24)
http://tp4.sinaimg.cn/1646706835/50/40090027455/1 hbyido 网页版 2015-08-13 22:12
经验总结 博客 代码
《Collapsed Gibbs Sampling for Dirichlet Process Gaussian Mixture Models》http://t.cn/RL1GODG
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 22:04
经验总结 自然语言处理 Seth Grimes 博客 情感分析
【情感分析须知十一条】《11 things to know about Sentiment Analysis》by Seth Grimeshttp://t.cn/RL1GbPY
http://ww4.sinaimg.cn/large/5396ee05jw1ev1c14lpu8j208c04yq44.jpg
http://tp2.sinaimg.cn/1785748853/50/40004237873/1 星空下的巫师 网页版 2015-08-13 21:59
算法 论文 神经网络
arXiv The Effects of Hyperparameters on SGD Training of Neural Networkshttp://t.cn/RL1bejs
Copper_PKU 网页版 转发于2015-08-13 22:03
今天刚把这篇paper放到reading list
http://tp3.sinaimg.cn/1286528122/50/40028223938/1 微软亚洲研究院 网页版 2015-08-13 19:31
会议活动 算法 语音 自然语言处理 会议 神经网络
【让机器自然地发出人类的声音~】在与机器的对话中,机器所发出的那种机械、无情感、语调稳定的声音始终提醒我们机器与人类的距离。不久前微软举办的圆桌会议“信号处理和语音研究“就语音合成及文本-语音转化问题进行了讨论。利用深层神经网络技术,也许能进一步缩小和人差距。>http://t.cn/RL1woRl
http://ww2.sinaimg.cn/large/4caedc7agw1ev17pe4jiaj20ds0e975t.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 16:43
自然语言处理 George W. Bush Joseph Stalin Martin Luther King Michael Jackson Queen Elizabeth
【用NLP判断名人社会文化特征】《A.I Astrology – Predicting Social Characteristics of Famous People using Natural Language Processing》by samim Martin Luther King, Jr./Joseph Stalin/Michael Jackson/Queen Elizabeth II/Mahatma Gandhi/George W. Bush/Mother Teresa @samim/a-i-astrology-804cbec95968″>http://t.cn/RL3kRK6
http://ww2.sinaimg.cn/large/5396ee05jw1ev12t5xrghj20sq0t4dng.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 16:27
资源 自然语言处理 PDF
【幻灯:关于Word2Vec的方方面面】《Word2Vec and all the things》by chrisemoody , Data Labs at Stitch Fix http://t.cn/R2kxAtR 云:http://t.cn/RL3Dgum
http://ww4.sinaimg.cn/large/5396ee05jw1ev12bg0sg8j20nm0db3zu.jpg
http://tp3.sinaimg.cn/2288385870/50/5607746678/1 赵家平USC 网页版 2015-08-13 14:01
深度学习 资源 自然语言处理 PDF 课程
Ruslan’s deep learning tutorial @ MLSS, 从 audio, vision 到 NLP, 不错 http://t.cn/RL3Y2z2http://t.cn/RL3Y2zL
http://tp2.sinaimg.cn/2295615873/50/5709954620/1 英特尔商用频道 网页版 2015-08-13 13:00
应用 自然语言处理 推荐系统
【用机器学习革新音乐推荐】所有推荐系统的难题,是如何在用户习惯和新口味之间取得平衡,音乐也不例外。Spotify从MIT聘来数据专家,这篇文章分析如何通过自然语言处理,推荐出更好的歌单。http://t.cn/RLHeCqS
http://ww4.sinaimg.cn/large/88d45181jw1euzsvebownj20hs0c3gme.jpg
http://tp4.sinaimg.cn/1787451427/50/40044484432/1 FPGA开发圈 网页版 2015-08-13 12:01
深度学习 算法 神经网络
【Auviz Systems发布面向SDAccel的全新深度神经网络 (DNN) 库】Auviz Systems 现在提供的全新 DNN 库能够与 SDAccel 配合使用,面向 FPGA 开发机器学习 DNN 应用。设计人员可通过调用带有相应参数的函数,使用这些库实现 AlexNet 等卷积神经网络 (CNN) 算法。http://t.cn/RL3Q9og
http://ww1.sinaimg.cn/large/6a8a5823gw1ev0upno8m5j20go09etar.jpg
http://tp4.sinaimg.cn/1734252803/50/5658041589/1 MATLAB 网页版 2015-08-13 12:00
会议活动 视觉 算法 活动
#MathWorks网上研讨会# 教您使用MATLAB来进行图像和视频的显示、分析和算法开发,诸如图像增强、图像分割、特征提取、空间变换、图像配准、纹理分析、物体识别和跟踪等内容,带您精通MATLAB图像处理的强大功能,开始学习吧~ http://t.cn/RL3Q6ui
http://ww4.sinaimg.cn/large/675e9903jw1euyfe3uymej21kw11xagq.jpg
http://tp3.sinaimg.cn/5648620342/50/5731472374/1 闫安Jon 网页版 2015-08-13 10:49
算法 论文 神经网络
Possible Mechanisms for Neural Reconfigurability and their Implicationshttp://t.cn/RL3jo0A 树突树上较高层的乘性突触可以实现神经元甚至整个通路的重新配置。虽然文章主要内容都是作者的猜想,但我觉得丘脑、屏状体这类连接集中的灰质地带,或许还挺需要类似机制的。
http://ww4.sinaimg.cn/large/006ah2bIjw1ev0smob608j30ji0fzaca.jpg
http://tp1.sinaimg.cn/1646218964/50/1279883225/1 IT技术博客大学习 网页版 2015-08-13 10:14
自然语言处理 语言学
【互联网时代的社会语言学:基于SNS的文本数据挖掘】 挖掘新词的传统方法是,先对文本进行分词,然后猜测未能成功匹配的剩余片段就是新词。这似乎陷入了一个怪圈:分词的准确性本身就依赖于词库的完整性,如果词库中根本没有新词,我们又怎么能… 详见:http://t.cn/zjKALWa
http://tp3.sinaimg.cn/5594081530/50/5726531681/1 CCF通讯 网页版 2015-08-13 09:24
深度学习 语音 凌震华
2015年第8期专题文章【语音信号与信息处理中的深度学习】,作者:魏 思 凌震华 杜 俊 等http://t.cn/RL3pQLn
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页版 2015-08-13 08:04
算法 语音 自然语言处理 神经网络
第59期NLP日报(2015-08-12) 1) 论文: 基于词嵌入的文本距离度量 2) 论文: 考虑句法信息的多义词嵌入用于语义复合 3) 基于word2vec/word mover’s distance的餐馆评论归纳浏览 4) Google语音转录背后的神经网络 完整版12条 http://t.cn/RL39zBT
http://ww2.sinaimg.cn/large/005HjjGQgw1ev0nunbrljj31ai0ontfq.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页版 2015-08-13 08:02
深度学习 视觉
第140期计算机视觉日报(2015-08-12) 1) 计算机视觉和机器学习领域近两年部分综述文章 2) 机器视觉相关术语 3) 图像识别中的深度学习 完整版7条 http://t.cn/RL39vhG
http://ww1.sinaimg.cn/large/005HjjGQgw1ev0nsrcvg5j30go09e3z2.jpg
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页版 2015-08-13 07:58
会议活动 算法 应用 资源 PDF RecSys WSDM 会议 社交网络 推荐系统 预测
社交网络中,用户会加入多个社区(如QQ群?),社区的特性反过来体现了用户的某些兴趣. Overlapping Community Regularization for Rating Prediction in Social Recommender Systems考虑用户加入的社区(可能学习而来), 扩展SocialMF和SoReg http://t.cn/RL3K1aJ
http://ww2.sinaimg.cn/large/972a1170gw1ev0noqqn9oj21d30ezn2y.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 07:44
Python 代码 论文
【论文+(Python)代码:虚拟对抗训练(VAT)分布式平滑】《Distributional Smoothing with Virtual Adversarial Training》T Miyato, S Maeda, M Koyama, K Nakae, S Ishii (2015)http://t.cn/RL3KLa4 code:http://t.cn/RL3KLaU GitXiv:http://t.cn/RL3KLab
http://ww1.sinaimg.cn/large/5396ee05jw1ev0n6lfdlkj20gp0djgps.jpg
http://tp1.sinaimg.cn/5220650532/50/5701668539/1 好东西传送门 网页版 2015-08-13 07:23
深度学习 视觉 应用 自然语言处理 Kaggle 机器人 简报 王晓刚
第328期机器学习日报(2015-08-12)http://t.cn/RL3oSNg 1) From Word Embeddings To Document Distances 2) 小i机器人:智能客服的最强大脑 3) 王晓刚: 图像识别中的深度学习 4) 升级恐惧与人工智能 5) kaggle的比赛在machine learning领域是什么地位? 完整版30条http://t.cn/RL3oSNe
http://ww3.sinaimg.cn/large/005HjjGQgw1ev0mnwfmxjj31g30syn2k.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 06:44
会议活动 深度学习 视觉 应用 资源 ECCV PDF 会议 机器人
【论文+(Matlab)代码:基于深度特征(CNN)的(自然场景)文字检测与识别】《Deep Features for Text Spotting》 M. Jaderberg, A. Vedaldi, A. Zisserman (ECCV 2014) http://t.cn/RL3SiReHome:http://t.cn/RL3SiRD Code:http://t.cn/R2lax8g GitXiv:http://t.cn/RL3SiRg
http://ww1.sinaimg.cn/large/5396ee05jw1ev0liztahzj20gd0730uw.jpg
机器学习与数据挖掘 网页版 转发于2015-08-13 10:12
hi,亲们 8月22日《个性化推荐》、《机器学习高级班》新班级开课哦!http://t.cn/RvHIpcE感兴趣的童鞋请小窗口咨询QQ:2439989599
http://tp2.sinaimg.cn/1548358505/50/1288833405/1 金连文 网页版 2015-08-13 06:37
深度学习 算法 代码 论文 神经网络 统计
“Dropout as a Bayesian Approximation: Representing Model Uncertainty in Deep Learning” http://t.cn/RLa1DJz Code: http://t.cn/RL3S5wS
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 05:55
会议活动 应用 SIGIR 会议 信息检索
【论文:(SIGIR 2015 “Test of Time”)个人信息检索与重用系统SIS】《Stuff I’ve seen: a system for personal information retrieval and re-use》 S Dumais, E Cutrell, J Cadiz, G Jancke, R Sarin, D Robbins (SIGIR 2003) http://t.cn/RL3axHG
http://ww1.sinaimg.cn/large/5396ee05jw1ev0k3yl8thj20f10aqgon.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 05:46
会议活动 算法 应用 SIGIR 回归 会议 集成学习 信息检索
【论文:(SIGIR 2015最佳论文)回归树加性集成文档排序快速算法QuickScorer】《QuickScorer: A Fast Algorithm to Rank Documents with Additive Ensembles of Regression Trees》C Lucchese, F Nardini, S Orlando, R Perego, N Tonellotto, R Venturini (SIGIR 2015)http://t.cn/RL3aqZr
http://ww4.sinaimg.cn/large/5396ee05jw1ev0juj8jduj208y062jrt.jpg
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-13 05:33
经验总结 Kaggle 博客
【Kaggle每周代码精选七月汇总】《July 2015: Scripts of the Week》http://t.cn/RL3ah7v
http://ww4.sinaimg.cn/large/5396ee05jw1ev0jex116yj20c808k3zq.jpg
http://tp2.sinaimg.cn/3665442037/50/40031329894/1 EchoJS_News 网页版 2015-08-13 04:01
算法 神经网络
《Classify text with Neural Networks and BOW (with brain and mimir)》原文:@tech_fort/classifying-text-with-neural-networks-and-mimir-in-javascript-94c9de20c0ac”>http://t.cn/RL36xsN 来自:medium.com
http://ww2.sinaimg.cn/large/da7a34f5jw1ev0gtvu55hj20sg6t3e81.jpg
温故知新 (3)
更早的微博,有新精彩评论或被再次推荐
2015-08-12 (1)
http://tp1.sinaimg.cn/1922397344/50/5668492812/1 白硕SH 网页版 2015-08-12 10:33
经验总结 博客
评论@白硕SH 的博文【升级恐惧与人工智能 ——《机器姬》观后留言】:”为什么没有分享到微博?”查看原文:http://t.cn/RLuNtun
西瓜大丸子汤 网页版 转发于2015-08-13 05:14
人类的感情,贪婪和恐惧都是基于人类肉体的。人类的情欲、社会性、权力欲,都是受颅骨、骨盆、脑的能耗等的约束才产生出来的。机器不会发展出人类的情感,即使被人类注入也必然会在演化中淘汰。
2015-08-04 (1)
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页版 2015-08-04 05:27
经验总结 应用 博客 特征工程 预测
【特征工程 vs. 特征提取】《Feature Engineering versus Feature Extraction: Game On!》http://t.cn/RLlQcTk
http://ww3.sinaimg.cn/large/5396ee05jw1euq4nrda6gj20a00a0dg8.jpg
爱可可-爱生活 网页版 转发于2015-08-13 05:21
@CSDN云计算 提供的译文《特征工程 vs. 特征提取:比赛开始!》http://t.cn/RL3v34J
睡眼惺忪的小叶先森 网页版 转发于2015-08-13 08:54回复 @phunter_lau “支持翻译”
支持翻译,这种以unsupervised learning model为例介绍feature learning的情况不多啊?DL除外。还是以LR来讲解比较合适。。。
2015-06-26 (1)
http://tp1.sinaimg.cn/2536116592/50/5716095299/1 iB37 网页版 2015-06-26 20:21
会议活动 算法 应用 NIPS UAI 会议 教育网站 推荐系统 主题模型
法国数学家泊松(1781-1840)1837年发表泊松分布刻画固定时间段内离散事件发生次数的概率,期望和方差都等于分布的参数. LDA作者Blei将其用于推荐系统打分建模: Hierarchical Poisson Factorization ; Poisson factorization http://t.cn/R2kPzpY
http://ww2.sinaimg.cn/large/972a1170jw1ethntdcj0wj20kb0lsq5r.jpg
十月伤感wb 网页版 转发于2015-08-13 01:18
@iB37: 动态泊松分解 Dynamic Poisson Factorization 捕捉用户兴趣和产品受欢迎度随时间的演化 http://t.cn/RLuoX1I 实验数据集: 除了netflix,还有arXiv.org的点击,顺道探索和理解这一科学研究的不可或缺的工具. 评估度量: 查全率 归一化折扣累积增益NDCG MRR MAR
iB37 网页版 转发于2015-08-13 08:24回复 None “动态泊松分解…”
社会泊松分解A Probabilistic Model for Using Social Networks in Personalized Item Recommendation 讲稿和代码: http://t.cn/RL3CPJg
页:
[1]