解应春BW 发表于 2016-1-24 09:19:32

机器学习日报 2016-01-22 机器学习和统计模型的差异;用机器学习去侦查匿名代码的作者

机器学习日报 2016-01-22
[*]【社区问答系统及相关技术】by 王斌 @爱可可-爱生活
[*]用机器学习去侦查匿名代码的作者 @王威廉
[*]关于神经网络初始化权值的小讨论 @孙明明_SmarterChina
[*]机器学习和统计模型的差异 @199IT-互联网数据中心
[*]Oxford、Stanford、Baidu的联合成果:Conditional Random Fields as Recurrent Neural Networks @视觉机器人

@好东西传送门 出品, 过往目录 见http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

邮件版包括20条,本期的Web版有完整内容30条
用日报搜索找到以前分享的内容: http://ml.memect.com/search/今日焦点 (5)
http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-01-22 16:42
自然语言处理 吉宗诚 问答系统
【社区问答系统及相关技术】by 王斌, 吉宗诚 via:智能立方 http://t.cn/RbQYrY8
http://ww3.sinaimg.cn/large/5396ee05jw1f08d83clakj20i10cfgms.jpg



http://tp4.sinaimg.cn/1657470871/50/5676743531/1 王威廉 网页链接 2016-01-22 14:28
资源 PDF 教育网站
去年的计算机安全著名会议USENIX Security 2015有篇特别厉害的跨界论文De-anonymizing Programmers via Code Stylometry,用机器学习去侦查匿名代码的作者:http://t.cn/RbQNjb4 准确率目测95%以上,感觉写破烂代码的童鞋以后很难深藏功与名了...
http://ww1.sinaimg.cn/large/62caff97gw1f089az6og0j20qo0wadqj.jpg



http://tp3.sinaimg.cn/1914450674/50/5644229416/1 孙明明_SmarterChina 网页链接 2016-01-22 11:07
算法 神经网络
一个关于神经网络初始化权值的小讨论:为什么权重需要限制在一个小区间,而不是[-1,1]?。综合了多个来源的说法,挺有意思。http://t.cn/RbQxd2L


孙明明_SmarterChina 网页链接 转发于2016-01-22 11:09
另一种初始化方法的来源: http://t.cn/Ryu0q79

孙明明_SmarterChina 网页链接 转发于2016-01-22 11:29回复 @Copper_PKU “我觉得初始化带来的收益很有限”
回复@Copper_PKU:这里主要说的是训练速度和数值稳定性,不是pre-train。数据量大的情况下,pre-train效果有限。



http://tp4.sinaimg.cn/1787567623/50/40052280411/1 199IT-互联网数据中心 网页链接 2016-01-22 08:00
统计
【机器学习和统计模型的差异】机器学习还被应用在YouTube 和Google的引擎推荐上, 机器学习通过瞬间分析大量的观测样本给出近乎完美的推荐建议。 即使只采用一个16 G 内存的笔记本,我每天处理数十万行的数千个参数的模型也不会超过30分钟。 http://t.cn/RbQG5JM
http://ww3.sinaimg.cn/large/6a8c1e07gw1f07mie98s6j20jg0baacz.jpg



http://tp1.sinaimg.cn/5501429448/50/5717596146/1 视觉机器人 网页链接 2015-10-01 08:58
会议活动 深度学习 视觉 算法 CRF ICCV 代码 会议 神经网络
Oxford、Stanford、Baidu的联合成果:Conditional Random Fields as Recurrent Neural Networks,文章已被ICCV2015录取。近期公开了该CRF-RNN图像语义分割的模型和代码。部分内容出现在最近的BBC节目http://t.cn/Ry0y9Ks 。github:http://t.cn/Ry0vEHg 之前的介绍:http://t.cn/Ry0UyFv
http://ww3.sinaimg.cn/large/0060jr72gw1ewlbmnjoa3j30jy0dv437.jpg



最新动态
http://tp3.sinaimg.cn/1715118170/50/5653230631/1 网路冷眼 网页链接 2016-01-22 19:28
深度学习 资源 课程
【Google's Free Deep Learning Course】http://t.cn/R48TwR2 来自Google的免费深度学习课程。在这门课程中,你将会对学习的动机有一个清晰的认识,并从复杂和/或大型数据集学习而设计出一个智能系统。




http://tp4.sinaimg.cn/1750070171/50/5734745738/1 36氪 网页链接 2016-01-22 18:16
深度学习 算法 资源 课程 神经网络 新闻
【Google在Udacity推出机器深度学习课程,免费分享机器学习研究成果】Google 于昨天宣布将在 MOOC 供应商Udacity上推出机器深度学习课程。简单的讲,课程将涉及使用大量数据对人工神经网络进行培训,即让机器在现有知识的基础上根据新数据进行推断和学习。详情请戳:http://t.cn/RbQoMGF




http://tp4.sinaimg.cn/1744228463/50/5641468991/1 数说工作室网站 网页链接 2016-01-22 17:40
视觉 算法 应用 自然语言处理 机器人 神经网络 问答系统
【要让“机器人”能讲出图像背后的故事】微软亚洲研究院视觉计算组在去年的一项比赛中,对深层神经网络技术又进行了突破:目前普遍使用的神经网络层级能够达到20到30层,该团队实现了152层。微软的聊天机器人小冰不仅能识别图像类型和要素,还能进行人性化的描述。http://t.cn/R4YCZGe




http://tp1.sinaimg.cn/5501429448/50/5717596146/1 视觉机器人 网页链接 2016-01-22 17:18
经验总结 深度学习 视觉 算法 KNN Python 博客 聚类 神经网络
#资源共享# 深度学习系列的笔记和总结(2016-01):http://t.cn/RbQQPXO theano、caffe、RBM、卷积神经网络、RNN、性别年龄识别、人脸特征点定位、相似度判别、物体检测、图像分割、Network in network、K-means、keras、Dropout、Maxout网络学习、稀疏自编码。另外就是博主写的比较整洁。
http://ww2.sinaimg.cn/large/0060jr72gw1f08e90xbwqj30j50u8qbv.jpg



http://tp1.sinaimg.cn/5501429448/50/5717596146/1 视觉机器人 网页链接 2016-01-22 15:11
经验总结 视觉 算法 博客
#资源共享# OpenCV系列(2016-01):http://t.cn/RbQ0dBz 2)读取png图片显示到QT label上的问题(博乐推荐) 、3)二值化图像、4)calcHist 计算图像的直方图、5)通过反投影直方图以检测特定的图像内容、6)使用均值漂移(Mean Shift)算法实时跟踪视频流中的物体(博乐推荐)
http://ww1.sinaimg.cn/large/0060jr72gw1f08aih9iczj30iy07g40k.jpg



http://tp3.sinaimg.cn/5703425466/50/40107979225/0 ITOA瞭望 网页链接 2016-01-22 15:09
可视化
ITOA提供一套有价值的先进技术,但领导者必须执行四个阶段的功能。本研究概述了组织应怎样高效执行每个阶段以便达到投入的最大化。执行ITOA的四个阶段,需由数据输入、存储、使用开始,发展至可视化和聚合。#ITOA# #日志管理# #Log Management# http://t.cn/RbQ0uAM


陈自欣 网页链接 转发于2016-01-22 15:37
要将日志分析应用至运维运营,想象前景很广阔,但是,这事得一步一步来,本文就说清楚了,该如何一步一步来。如果一上来就弄机器学习,期望值一下弄得太高,其实不好落地。



http://icon.memect.com/http://feedproxy.google.com/~r/Techcrunch/~3/4lOzv2oiPfM/ techcrunch:TC 网页链接 2016-01-22 15:00
应用 自然语言处理 Jared Feldman 行业动态 情感分析 社交网络
【Canvs Raises $5.6M To Help TV Networks Track Viewers’ Emotions】Canvs is a startup measuring emotion on social media, but CEO Jared Feldman insisted that we shouldn’t think of it as a social sentiment company. He said that’s because existing tools for measuring sentiment have earned something of a bad reputation. Where those tools are usually limited to classifying social media posts as good, bad or neutral, Canvs can classify a statement into… http://memect.co/1vb1g3dyqe4
https://tctechcrunch2011.files.wordpress.com/2016/01/tvremote.jpg?w=680



http://tp4.sinaimg.cn/3659841663/50/5669702006/0 GoSSIP_SJTU 网页链接 2016-01-22 14:57
经验总结 博客
#安全论文每日读# Automatically Deriving Pointer Reference Expressions From Binary Code for Memory Dump Analysis是发表在FSE'15上的论文。本文提出一种的新的概念ptr-rexp,这种表达式可以帮助定位指针在内存中的位置,能够被用来检测内核函数指针的完整性。阅读笔记:http://t.cn/RbQ0L8q




http://tp2.sinaimg.cn/1402400261/50/5713579194/1 爱可可-爱生活 网页链接 2016-01-22 14:13
会议活动 AAAI David Bamman Noah A. Smith 会议
【论文:基于上下文信息的Twitter讥讽检测】《Contextualized Sarcasm Detection on Twitter》David Bamman, Noah A. Smith (2016) http://t.cn/RbQCu2K 参阅《Computers Learn to Detect Sarcasm on Twitter | MIT Technology Review》http://t.cn/RbQCu29
http://ww1.sinaimg.cn/large/5396ee05jw1f088v6z5d8j209a06cjrv.jpg



http://tp4.sinaimg.cn/1812671331/50/5730689288/1 TECH2IPO创见 网页链接 2016-01-22 13:43
应用 自然语言处理 行业动态 机器人 问答系统 新闻
【AI 初创公司 Viv Labs 为何拒绝被Google收购?】Facebook和Google都曾愿以1亿到2亿美元的价格收购Viv Labs,但都被拒绝。倒不是因为Siri工程师出身的创始人不差钱,他希望能开发出独立于巨头生态系统的AI产品,不仅能作为聊天机器人,还能被第三方开发者训练应用于特殊场景。http://t.cn/RbQX9O2
http://ww1.sinaimg.cn/large/6c0b2b63jw1f0881ylhqij20hp08y41a.jpg



http://tp1.sinaimg.cn/5501429448/50/5717596146/1 视觉机器人 网页链接 2016-01-22 12:47
经验总结 深度学习 视觉 算法 KNN SVM 博客 聚类 神经网络
#资源共享# 深度学习与计算机视觉系列(2016-01):http://t.cn/RbQSxAZ 基础介绍、图像分类与KNN、线性SVM与SoftMax、最优化与随机梯度下降、反向传播及直观理解、神经网络结构与神经元激励函数、神经网络数据预处理,正则化与损失函数、神经网络训练与注意点、神经网络实现小例子、细说卷积神经网络
http://ww1.sinaimg.cn/large/0060jr72gw1f086d4f4mcj30gn0b7q5n.jpg



http://tp2.sinaimg.cn/2726943817/50/5631434162/0 物联网头条新闻 网页链接 2016-01-22 10:37
会议活动 应用 会议 机器人 智能汽车
【达沃斯聚焦“第四次工业革命”:区块链、3D打印、机器人】达沃斯年会第一天,讨论的重点落在人工智能、机器人、物联网、自动驾驶汽车、3D打印技术、区块链、量子计算等尖峰科技,而这些技术,或加剧不平等,并改变劳动格局。 http://t.cn/RbQMyDq
http://ww2.sinaimg.cn/large/a289dc49jw1f082og6sj5j20p00gvabi.jpg



http://icon.memect.com/http://feedproxy.google.com/~r/Techcrunch/~3/tTSUPlU67zI/ techcrunch:TC 网页链接 2016-01-22 08:59
应用 Waldo Raises 社交网络
【Waldo Raises $5 Million For A Photo-Finding Platform Targeting Professional Photographers & Events】Numerous startups over the years have tried to tackle the problem of helping people track down the photos others have taken, but hadn’t yet shared with you. Today, the outsize winner in the space is Facebook, whose Moments application has taken over the social network’s photo syncing function, while leveraging Facebook’s massive scale to allow for easier private… http://memect.co/7gG1tvtyhOb
https://tctechcrunch2011.files.wordpress.com/2016/01/waldo-homepage.png?w=680



http://tp2.sinaimg.cn/2295615873/50/5709954620/1 英特尔商用频道 网页链接 2016-01-22 08:00
深度学习 视觉 应用 Python R语言 信息检索
【干货:200篇机器学习和深度学习资料】python、R语言、信息检索、图像卷积运算等等,道长在这为您收集了近二百篇关于机器学习和深度学习的资料,包含文档、视频、源码各种形式!还在等什么?赶紧点击链接转发收藏吧!http://t.cn/RbQG5Mu
http://ww2.sinaimg.cn/large/88d45181jw1f07djl14e0j20av064dgg.jpg



http://tp4.sinaimg.cn/1770891687/50/40086373345/1 phunter_lau 网页链接 2016-01-22 02:39
Kaggle 调参
我一般不在Kaggle比赛上贴Script,一旦我贴了,必定要内置DMLC的广告! Homesite这个比赛用xgboost暴力扫参刷排行榜一站式解决方案 http://t.cn/RbQ2Ipz 同时附送调参技巧。这个比赛其实挺无聊,现在public LB目测overfit严重可能结果出来掉成狗,各位同学调参时候相信自己相信CV。
http://ww1.sinaimg.cn/large/698da9a7gw1f07ot1joe9j21eg10cdr8.jpg





页: [1]
查看完整版本: 机器学习日报 2016-01-22 机器学习和统计模型的差异;用机器学习去侦查匿名代码的作者