一 16

2018年度GtiHub开源项目TOP 25：数据科学&机器学习

Posted on 2019年1月16日 by 织梦先生

本文作者 Pranav Dar 是 Analytics Vidhya 的编辑，对数据科学和机器学习有较深入的研究和简介，致力于为使用机器学习和人工智能推动人类进步找到新途径。2018 这一年中，作者在每个月都会发布一份开源项目月度推荐榜单，而本文则是对全年开源项目的盘点和总结。

前沿

关于托管代码、与团队成员合作以及充当展示个人写代码技能的「在线简历」，最好的平台是哪个？问及任何一位数据科学家，他们都会让你去 GitHub。近年来，GitHub 作为一个真正具有变革性的平台，已经改变了我们托管甚至写代码的方式。

但这还不是全部。此外，它还是一个学习平台。如果你问怎么学习的话，我可以给你一个暗示——开源项目！

世界领先的科技公司通过在 GitHub 上发布其热门算法的代码，对项目进行开源。2018 年，在 Google 和 Facebook 等公司的带领下，这类开源项目大幅增加。其中最好的那部分开源项目，写代码的研究者还提供了预训练模型，从而让你我这些人不必再浪费时间从头开始创建高难度的模型。 Continue reading →

九 23

10 种机器学习算法的要点（附 Python 和 R 代码）

Posted on 2017年9月23日 by 织梦先生

也许我们生活在人类历史上最关键的时期：从使用大型计算机，到个人电脑，再到现在的云计算。关键的不是过去发生了什么，而是将来会有什么发生。

工具和技术的民主化，让像我这样的人对这个时期兴奋不已。计算的蓬勃发展也是一样。如今，作为一名数据科学家，用复杂的算法建立数据处理机器一小时能赚到好几美金。但能做到这个程度可并不简单！我也曾有过无数黑暗的日日夜夜。

谁能从这篇指南里受益最多？

我今天所给出的，也许是我这辈子写下的最有价值的指南。

这篇指南的目的，是为那些有追求的数据科学家和机器学习狂热者们，简化学习旅途。这篇指南会让你动手解决机器学习的问题，并从实践中获得真知。我提供的是几个机器学习算法的高水平理解，以及运行这些算法的 R 和 Python 代码。这些应该足以让你亲自试一试了。

我特地跳过了这些技术背后的数据，因为一开始你并不需要理解这些。如果你想从数据层面上理解这些算法，你应该去别处找找。但如果你想要在开始一个机器学习项目之前做些准备，你会喜欢这篇文章的。

广义来说，有三种机器学习算法

1、监督式学习

工作机制：这个算法由一个目标变量或结果变量（或因变量）组成。这些变量由已知的一系列预示变量（自变量）预测而来。利用这一系列变量，我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续，直到模型在训练数据上获得期望的精确度。监督式学习的例子有：回归、决策树、随机森林、K – 近邻算法、逻辑回归等。

2、非监督式学习

工作机制：在这个算法中，没有任何目标变量或结果变量要预测或估计。这个算法用在不同的组内聚类分析。这种分析方式被广泛地用来细分客户，根据干预的方式分为不同的用户组。非监督式学习的例子有：关联算法和 K – 均值算法。

3、强化学习

工作机制：这个算法训练机器进行决策。它是这样工作的：机器被放在一个能让它通过反复试错来训练自己的环境中。机器从过去的经验中进行学习，并且尝试利用了解最透彻的知识作出精确的商业判断。强化学习的例子有马尔可夫决策过程。

常见机器学习算法名单

这里是一个常用的机器学习算法名单。这些算法几乎可以用在所有的数据问题上：

线性回归
逻辑回归
决策树
SVM
朴素贝叶斯
K最近邻算法
K均值算法
随机森林算法
降维算法
Gradient Boost 和 Adaboost 算法

Continue reading →

九 23

七步精通Python机器学习

Posted on 2017年9月23日 by 织梦先生

开始。这是最容易令人丧失斗志的两个字。迈出第一步通常最艰难。当可以选择的方向太多时，就更让人两腿发软了。

从哪里开始？

本文旨在通过七个步骤，使用全部免费的线上资料，帮助新人获取最基本的 Python 机器学习知识，直至成为博学的机器学习实践者。这篇概述的主要目的是带领读者接触众多免费的学习资源。这些资源有很多，但哪些是最好的？哪些相互补充？怎样的学习顺序才最好？

我假定本文的读者不是以下任何领域的专家：

▪ 机器学习

▪ Python

▪ 任何 Python 的机器学习、科学计算、数据分析库

如果你有前两个领域其一或全部的基础知识，可能会很有帮助，但这些也不是必需的。在下面几个步骤中的前几项多花点时间就可以弥补。

Continue reading →

织梦先生

一个从零开始并且为了自己心底的理想不断奋斗中的人

Tag Archives: 机器学习

2018年度GtiHub开源项目TOP 25：数据科学&机器学习

10 种机器学习算法的要点（附 Python 和 R 代码）

谁能从这篇指南里受益最多？

我今天所给出的，也许是我这辈子写下的最有价值的指南。

广义来说，有三种机器学习算法

1、监督式学习

2、非监督式学习

3、强化学习

常见机器学习算法名单

Continue reading →

七步精通Python机器学习

谁能从这篇指南里受益最多？

我今天所给出的，也许是我这辈子写下的最有价值的指南。

广义来说，有三种机器学习算法

1、 监督式学习

2、非监督式学习

3、强化学习

常见机器学习算法名单

Continue reading →

1、监督式学习