了解数据科学的编程语言,这是Coursera,9,通用编程语言

2020-06-06 17:21    来源:互联网    编辑:小狐    浏览量:982

在256种编程语言中,了解数据科学的编程语言!出品 CSDN(ID:CSDNnews)关于数据科学中Python和 R的较量已经有足够多的论述了,但是我在这里不是谈论这个问题。两种语言我们都需要这就是

在256种编程语言中,了解数据科学的编程语言!

了解数据科学的编程语言,这是Coursera,9,通用编程语言(图1)

出品 CSDN(ID:CSDNnews)

关于数据科学中Python和 R的较量已经有足够多的论述了,但是我在这里不是谈论这个问题。两种语言我们都需要这就是我想说的全部。我已经创建了数据科学的十大编程语言列表,您可以在2020年学习这些语言,当然也可以尝试列表外的语言。

我选择语言列入榜单时,主要根据其受欢迎程度,Github被提及的次数,优缺点以及与2020年数据科学的相关性。

Python

第一个数据科学中所需要的就是Python。

我可以写几十篇关于Python为什么是数据科学首选语言的文章。

由于它的多功能性,数据科学家可以使用Python来解决几乎所有与数据科学相关的问题。

为什么是Python?

Python的面向对象特性使数据科学家能够以更高的稳定性,模块化和代码可读性来执行任务。尽管数据科学只是多样化Python生态的一小部分,但Python拥有专门的深度学习和其他机器学习库以及像scikit-learn,Keras和TensorFlow等流行工具。Python 使数据科学家能够复杂的数据模型,并将其直接应用到生产。

根据Python人员的调查结果,有84%的受访者使用Python作为主要语言,而有16%的受访者将其作为第二语言。

Python中的数据

对于数据收集,Python支持CSV,JSON,SQL表和使用beautiful soup工具获取的网络数据。

用于Python的数据分析库panda是您用于数据探索的最佳工具。通过组织成数据帧,panda可以轻松地过滤、排序和显示数据。

NumPy —数值模拟分析

SciPy—科学计算与分析

对于数据可视化,matplotlib,plot.ly,nbconvert可以将Python文件转换为HTML文档,列出漂亮的图形和仪表板,帮助数据科学家既有力又美观地来展示研究结果。

R

R是一个开源工具,它允许数据科学家跨平台地使用诸多操作。统计是这一技术的核心优势。R不仅仅是一种语言,它本身就是一个进行统计计算的生态。它的内置函数有助于执行数据处理、数学建模、数据可视化操作等。

R中的数据

R支持Excel,CSV,文本文件,Minitab或SPSS文件格式,使用Rvest获取的网络数据以及其他常见的用于数据收集的文件格式。

R是一种适合于科学可视化的健壮环境,有许多专门用于数据可视化结果图形显示的软件包。我们可以使用图形模块获得基本图形,图表和绘图。可视化效果也可以保存为jpg.等图像格式或单独的PDF文件。ggplot2是高级图(例如带有回归线的复杂散点图)的福音。

R Vs Python

对于数据科学来说,关于Python与R的争论是永无止境的,但是作为数据科学家,我们需要明白,虽然两者都有优点,但也都有缺点。

大多数程序员将一种或另一种编程语言视为他们的“首选”假设,R用户有时渴望Python语言中内置的面向对象的功能。类似地,一些Python用户梦想着R中内置的统计分布。这意味着很有可能在一个项目中结合这两种领先的技术来得到一组独特的互补函数。

Scala

Scala是一种结合面向对象和函数式编程的简洁的高级语言。这种语言最初是为Java虚拟机(JVM)构建的,Scala的强项之一是与Java代码交互非常容易。

为什么选择Scala?

选择Scala学习数据科学的主要原因之一可以归功于Apache Spark。结合Scala与Apache Spark一起来处理大数据(Big Data)这对于数据科学家来说是无价的。

许多基于Hadoop构建的高性能数据科学框架通常都是使用Scala或Java编写的。在这些环境中使用Scala的原因是由于它对并发性的顺滑支持。由于Scala是在JVM上运行,因此与Hadoop搭配起来简直无敌。

为什么不使用Scala?

Scala唯一的缺点是它的学习曲线。另外,它的社区不是很活跃,因此在出现错误的情况下自行寻找问题的答案就会变得很繁琐。

当数据量大到足以实现该技术的全部潜力时,Scala非常适合这类项目。

SAS

SAS —统计分析

与R一样,SAS是为高级数据分析和复杂的统计操作而的工具。它是一种封闭源代码的专有工具,了各种各样的统计功能来执行复杂的建模。SAS由于其高可靠性而被大型组织和专业人员广泛使用。

为什么选择SAS?

请注意,SAS不是最适合初学者和独立数据科学爱好者的工具,因为SAS是为满足不断发展的业务需求而量身定制的。但是,如果您希望将数据科学作为自己的职业,那么最好掌握SAS的操作知识,以获得清晰的认识。

SAS擅长通过SAS Base(运行SAS环境的主要编程语言)执行统计建模。

为什么不使用SAS?

尽管SAS一直是企业分析领域无可争议的市场领导者,但要与Python或R进行功能比较,SAS似乎很难对数据进行建模和可视化。学习曲线非常棘手,并且通常被拥有巨大预算的大型公司使用。

SAS为数据科学家了多种认证计划。包括以下几种:

1SAS Academy for Data Science

2SAS Programmer Professional Certificate Coursera

Julia

Julia语言处理数据的速度比Python,Java,Matlab,R要快,在性能上略逊于Go,Lua,Fortran和C。数值分析是该技术的优势,但是Julia也能很好地应对通用编程。

为什么选择Julia?

Julia比其他脚本语言更快,这使得数据科学家可以在快速Python / MATLAB / R的同时生成快速的代码。

借助Julia数据生态,数据加载非常快速。它并行执行聚合,联接和预处理操作。Julia包括各种数学库,数据处理工具以及用于通用计算的软件包。除此之外,与来自Python,R,C / Fortran,C ++和Java的库的集成非常容易。

为什么不选择Julia?

由于Julia不是一个完全成熟的工具,因此社区范围仍然很有限。在查找错误或故障时,有限的选项或解决方案可能会成为障碍。业内专家们非常希望,当Julia变得更加成熟时,能够与Python和R全面竞争。

MATLAB /Octave

A方案— MATLAB

MATLAB是第一个用于数据科学的工具。我是在2017年开始学习数据科学的,当时我在Coursera上学习了吴恩达(Andrew Ng)的机器学习课程,他在课堂上使用了Octave。与此同时,我在本科课程中学习MATLAB,并在Courser课程中练习MATLAB。

我知道MATLAB是执行深刻的数算最好的编程语言。数据科学大量涉及到数学,这使得这项技术成为进行数学建模,图像处理和数据分析的强大工具。

为什么选择MATLAB?

它拥有一个庞大的数学函数库,用于线性代数,统计,傅立叶分析,滤波,优化,数值积分和求解常微分方程。MATLAB了用于可视化数据的内置图形和用于创建自定义绘图的工具。

为什么不选择MATLAB?

现在,数据科学家很少使用MATLAB,尽管他们说MATLAB对于数学和建模非常有用。随着R和Python在数据科学领域的问世,MATLAB逐渐衰落。鉴于高昂的许可费用,它目前仅在学术界流行。

您在数据科学中使用的语言在很大程度上取决于您正在解决的问题。如果您的问题需要复杂的数学计算,至少对于初始数据探索和初步结果而言,那么没有比MATLAB更好的起点了。

B方案—OCTAVE

它是MATLAB的主要替代方案。一般来说,这两种技术没有本质的区别,只是有一些小的的差别。与MATLAB一样,如果需要强大的算术计算,Octave可以用于数据量相对较小的项目中。

Java

Java可能是用于编程和业务的最古老的面向对象语言之一。Hive,Spark和Hadoop等大多数知名的大数据工具都是用Java编写的。Java有许多我们可能不知道的用于数据科学的库和工具,例如Weka,Java-ML,MLlib和Deeplearning4j。

为什么选择Java?

Java可能不会成为数据科学的一种显而易见的语言,但是由于诸如Hadoop之类的许多数据科学框架都运行在Java虚拟机(JVM)上,它仍是数据科学的顶级编程语言之一。

Hadoop是一种流行的数据科学框架,用于大数据应用程序的数据处理和存储。Hadoop具有一次处理无限任务的能力,因此它支持存储和处理大量数据。

总而言之,如果您想享受Hadoop框架的功能,Java是最好的数据科学编程语言之一。

Perl

Perl是高级编程语言,通用编程语言,并且是解释性的动态编程语言。由于Perl语言依赖于轻量级数组,因此Perl能够更有效地处理数据查询,而不需要程序员的过多处理。

为什么选择Perl?

由于它具有通用脚本语言的多功能性,因此作为动态类型化的脚本语言它与Python有很多共同点。Perl在诸如生物信息学,金融和统计分析等定量领域中得到了应用。

Perl通过协调大规模的数据插入和查询,以简单,可维护的架构映射或减少TB级的数据。Perl 6的计划是一种模块化,可插入的体系结构,并具有针对大数据的灵活性和定制性。

为什么不选择Perl?

Perl并不是一种仅靠学习就可以使您成为高效的数据科学家的语言。它的速度不够快,语法也不友好。由于它是一种相对不受欢迎的语言,因此社区对数据科学的支持较少。值得一提的是,“ Perl人员”社区正在变得越来越多。总体而言,目前并没有将Perl为数据科学语言的动力。

Haskell

Haskell是一种具有类型推断功能的通用静态类型纯函数式编程语言。

为什么选择Haskell?

Haskell具有强大的财务代码基础,可以轻松与Excel交互进行计算。这对编码数学概念很有用。一般来说,Haskell擅长抽象,因此,与其他任何数学或软件工具一样,数据科学也可以从Haskell的连贯抽象中受益。

Haskell也可以使用HaskellR直接对R中的值进行运算。

Haskell拥有DataHaskell,DataHaskell是一种利用Haskell编程语言来进行可靠且可复制的数据科学和机器学习的开源资源。Haskell的数据科学社区肯定会随着DataHaskell的发展而发展。

Target的首席AI科学家说:“ Haskell具有表现力,更快,更安全。Haskell传统上不用于数据科学,因此库的选择受到限制。Haskell与数学有着密切的关系,最终它的类型和数学特性对特定领域的业务代码的帮助会比其他任何东西都强大。”

为什么不选择Haskell?

Haskell具有作为数据科学语言的应用程序,但是,Haskell的数据科学知识还没有Python或R丰富。Haskell在数据科学功能方面并不强大。学习曲线本质上是困难且耗时的。

本文相关词条概念解析:

数据

数据就是数值,也就是我们通过观察、实验或计算得出的结果。数据有很多种,最简单的就是数字。数据也可以是文字、图像、声音等。数据可以用于科学研究、设计、查证等。数据背景是接收者针对特定数据的信息准备,即当接收者了解物理符号序列的规律,并知道每个符号和符号组合的指向性目标或含义时,便可以获得一组数据所载荷的信息。数据作为信息的载体,当然要分析数据中包含的主要信息,及分析数据的主要特征。数据(Data)是载荷或记录信息的按一定规则排列组合的物理符号。

相关资讯

相关评论

推荐阅读

春情再与红尘伴(原创)

春情再与红尘伴(原创)
等花,像等了一世;盼春,像盼了千年。终于,严冬匿身而退,像个虐够的狂徒,放下了手中的皮鞭。终于,春季如一位写意的佳人,她明眸晧齿,衣袂翩翩,正从日下云端,款款而来。终于,春季如一首美妙的序曲,在山水之
06-22

怀念天堂里的奶奶

怀念天堂里的奶奶
又到了3月18日,在我的生命中,这是一个爱的日子,也是个流泪的日子。这是奶奶的。每年的这个时候,总是最想念奶奶的时候。想念奶奶慈祥的笑容,也想念奶奶呼唤我的声音。我从一出生,就在奶奶家生活。从小爸爸妈
06-22

好人一生平安

好人一生平安
父亲发病的那天晚上,我们本都在老家,晚上九点了,女儿却哭闹着要回城里,九点多出发,到的时候都十点了,回家冲澡,哄孩子睡觉,十二点左右刚躺下,弟弟的电话就来了,说父亲的冠心病犯了,痛的厉害,手边没有救心
06-22

一一写在退休时,张乃新

一一写在退休时,张乃新
善待退休后的自己一一写在退休时(张乃新)光阴似箭,不经意间我巳走向人生的退休之年。从呱呱坠地到两鬓染霜,岁月的行囊里装滿了酸甜苦辣。接下来,在退休后的路上能走多远,取决于自己的体魄和心态。同志们常说我
06-22

诗的死亡

诗的死亡
我们将会被这个城市所封存,逃不出文字的牵绊。也不能用其他方式来贴近生命的真相,只能甘愿沦为它们的奴隶,只是为一个独白来维系生活中每一次的妥协。当我们相信诗的美好,其实诗只会在我们心中活着,现实上的诗也
06-22

Apache 两个开源项目比较:Flink vs Spark 1. 抽象 2. 内存管理 3. 实施语言 4. API 5. 流

Apache 两个开源项目比较:Flink vs Spark 1. 抽象 2. 内存管理 3. 实施语言 4. API 5. 流
Apache Flink 是新一代通用大数据处理引擎,旨在统一不同的数据负载。 听起来像 Apache Spark 吗? 是的。 Flink 正试图解决 Spark 试图解决的同样问题。 这两个都旨在
03-20

烟雨江南如诗如画,一段唯美邂逅

烟雨江南如诗如画,一段唯美邂逅
无烟雨不江南,烟雨江南如诗如画。多情自古江南雨,江南的雨分明就是有情人的泪,凄美动人。江南的烟雨,雨丝轻柔,烟雾弥漫,朦胧间似少女的面纱,几许深邃,几许神秘。江南雨霏霏,勾起江南人的心事。江南雨斜斜;
06-22

李铁8年放了8天假,黄紫昌受伤了,球员休息还是要休息

李铁8年放了8天假,黄紫昌受伤了,球员休息还是要休息
踢球是很正常的事情,有些球员为了球队或者国家队取得好成绩经常带伤出战,但是这样做真的行得通吗?近日,国足教练在和同济大学的学生上课时被问到了这个问题,李铁回答称:“自己是球员的时候,几乎和放假绝缘,过
06-22

在做青梅酒的时候,比如白酒的选择,掌握技巧,香醇补钙,营养好喝

在做青梅酒的时候,比如白酒的选择,掌握技巧,香醇补钙,营养好喝
青梅酒总做不好?白酒选择是关键,掌握技巧,香醇补钙,营养好喝马上就要立夏了,有很多的水果也是逐渐的上市,又到了一年吃青梅的时候,不知道你们都是怎么吃青梅的?你们会泡青梅酒吗?青梅这种水果口感虽然很清脆
06-22

乡野有地衣|原创

乡野有地衣|原创
春节前,好友捎来一包地衣。让我这个节日又增添了一份美味的菜肴。平凡的地衣,故乡最美的礼物,它温暖过我心灵背后所有的记忆…地衣是一种生长在植被野草间的菌类植物,是一道纯天然无污染的乡野美食。每当春天到来
06-22

热点资讯

精彩推荐

热门美图

网站地图

szbteng.cn 狮子奔腾信息网