要点 在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。 市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的功能有重叠,也各有权衡。 数据整理是数据预处理的…
  • 2017-04-28
大数据与AI乃至于云计算结合已是大势所趋。 说到最近几年最热门的技术流行语,少不了云计算、大数据、人工智能、物联网等热词。不过,尽管人人(至少是企业界)言必称大数据,但是其在企业的采用周期要远远滞后于…
  • 2017-04-09
这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是最重要的问题之一…
  • 2017-04-05
作者:toyld 岂安科技搬运代码负责人 机器学习 1959 年,美国塞缪尔 (Samuel) 设计了一个下棋程序,这个程序具有学习能力,它可以在不断的对弈中改善自己的棋艺。4年后,这个程序战胜了设计…
  • 2017-04-04
为了鼓励新工具的出现,机器学习和数据分析领域似乎已经成了“开源”的天下。Python 和 R 语言都具有健全的生态系统,其中包括了很多开源工具和资源库,从而能够帮助任何水平层级的数据科学家展示其分析工…
  • 2017-04-01
在 Google Cloud Next 谷歌云计算开发者大会上,华人 AI 学界的骄傲、谷歌云首席科学家李飞飞宣布了一则重大消息:谷歌收购 Kaggle。 谷歌收购数据科学公司Kaggle 增强机器学…
  • 2017-03-27
从去年开始,陆陆续续学习了大半年的机器学习,现在是时候做个总结了。 在以往的编程经验里面,我们需要对于输入有一个精确的,可控制的,可以说明的输出。例如,将1 + 1作为输入,其结果就是一个精确的输出 …
  • 2017-03-27
2017年已然来临,大数据技术仍然保持着飞速发展。无论是物联网、云计算领域乃至企业技术都开始将其引入自身并作为新的变革方向。 众多企业已经在积极接纳大数据技术,并作为提升自身市场竞争力的核心因素。在今…
  • 2017-03-19
本文我们来关注下三个非常相关的概念(深度学习、机器学习和模式识别),以及他们与2015年最热门的科技主题(机器人和人工智能)的联系。 图1 人工智能并非将人放入一台计算机中(图片来源于 WorkFus…
  • 2017-03-19
在机器学习领域,聚类与相似性搜索等用于实现数据集内亲和性的方法通常较难实现。如果大家希望对多达1亿张图片进行内容比较并找出其中哪些内容相似,这无疑将成为一项极为复杂的任务。事实上,其中最困难的部分在于…
  • 2017-03-10

微信公众号

微信公众号