1 定义、介绍
本文基于利用python进行数据分析
为什么使用numpy
1、R虽然科研好用,但实在不规范:虽然r非常熟悉,现在努力改正自己随意的习惯,但是代码习惯实在是难改,namespace方面出大问题。(要是习惯好美赛也不至于只有M)
2、数据分析实习一般用python(此乃实话)
相关库说明
1、NumPy:
numerical python,一个神,主要用于数组操作运算(线代),是阻击R的主力军
2、pandas:
人如其名,panel data,抄袭R的dataframe结构,感觉是原版R与dplyr包的结合,可以理解成是R伪军,根据之前的量化经历,这个是金融数据分析的主要库
3、matplotlib:
图形可视化核心,地位与R的ggplot一样,是神一般的存在。主要用以向不懂技术的boss输出数据结论的人话
目前只讨论三个主要的,反正就是numpy处理线代问题,pandas全文抄袭R,matplotlib就是python的ggplot。其他库有需要在介绍和安装
如何安装
1、pycharm直接点
2、pip install name
关于用shell还是IDE
尊重书作者意思,还是shell+text editor为妙,这边随意,写出好代码就是好环境、
关于R与python
R科学家:我们准备出第一季第二季第三季。。。
pythoner:我们准备出第零季第一季第二季。。。
其实两个语言还是比较像的
例如:python一组字典(eg.record)
读取一行:record[0]
读取一值:record[0][‘tz’]