这些Pandas演示tips,你一定相见恨晚……

大数据 数据分析
使用Pandas,就不必再将数据帧(DataFrame)里的值逐一复制到另一个软件中,它的格式化函数能够将数据帧转换成多种格式。无论是学生、数据科学家还是博士研究人员,这些技巧都一定能帮到你。

Pandas在数据分析中的重要作用不必多言。不管是Confluence上的一篇文章、GitHub中Readme文档,抑或一篇科学论文,每个项目都会以报告之类来收尾。

使用Pandas,就不必再将数据帧(DataFrame)里的值逐一复制到另一个软件中,它的格式化函数能够将数据帧转换成多种格式。

无论是学生、数据科学家还是博士研究人员,这些技巧都一定能帮到你。

这些Pandas演示tips,你一定相见恨晚……

图源:medium.com

下载Jupyter notebook,一起动动小手来试试吧!

设置

创建一个10行3列的数据帧,数值随机。

  1. n =10 
  2. df = pd.DataFrame( 
  3.     { 
  4.         "col1": np.random.random_sample(n), 
  5.         "col2": np.random.random_sample(n), 
  6.         "col3": [[random.randint(0,10) for _ in range(random.randint(3, 5))] for _ inrange(n)], 
  7.     } 

与HTML共享结果

这些Pandas演示tips,你一定相见恨晚……

通过使用to_html函数,可以将Pandas数据帧转换为HTML,这对于通过HTML发送自动报告十分有用。还可以在pandas分析服务器上制作API,这样就可以在网页浏览器的数据帧中追踪最新数值。

注意,这需要用到lxml软件包,可以用pip安装lxml。

  1. dfdf_html =df.to_html()with open( analysis.html ,  w ) as f: 
  2.     f.write(df_html) 

read_html函数甚至可以将HTML解析为pandas数据帧。笔者还没有使用过通用HTML进行尝试,但无疑会很有用。

  1. df_list =pd.read_html( analysis.html ) 
  2. df_list 

这些Pandas演示tips,你一定相见恨晚……

编写文件

在代码中编写注释时,将数据帧转换为字符串会非常有用。

  1. print(df.to_string()) 

这些Pandas演示tips,你一定相见恨晚……

Excel电子表格

Excel的大佬地位毋庸置疑,而Pandas能够将数据帧转化为Excel电子表格。使用pandas,人们可以轻松阅读Excel电子表格。

注意,需要xlwt和openpyxl软件包,可以用pip进行安装。

  1. df.to_excel( analysis.xlsx ,index=False

这些Pandas演示tips,你一定相见恨晚……

  1. pd.read_excel( analysis.xlsx ) 

这些Pandas演示tips,你一定相见恨晚……

Github创作

在存储库中,Github使用Markdown格式语言来编写README和Wiki文件。一个优秀的README文件能让项目更有可能被其他人采用。虽然在GitHub上逐步进行示范相当普遍,但将pandas数据帧手动格式化为markdown标记语言,会花费大量时间。这时Pandas可就帮了我们大忙。

  1. print(df.to_markdown()) 

这些Pandas演示tips,你一定相见恨晚……

撰写科学论文

大部分高质量的研究论文都是用LaTeX——一个高质量的排版系统编写而成。许多LaTeX作者制作数据帧截图,然后放在自己的论文中,还有许多人花了相当多的时间将数据帧的值格式化为LaTe X表格。

[[320676]]

图源:unsplash

pandas中的to_latex函数可以帮助人们完成繁重的任务。来看看这个例子:

  1. df.to_latex() 

这些Pandas演示tips,你一定相见恨晚……

结合使用print函数,你可以得到一个格式工整的输出结果。

  1. print(df.to_latex()) 

这些Pandas演示tips,你一定相见恨晚……

这些技巧帮到你了吗?

 

责任编辑:赵宁宁 来源: 读芯术
相关推荐

2020-05-06 09:18:56

Pandas函数大数据技术

2021-04-14 09:22:18

Python技巧交换变量值

2024-01-29 00:51:39

前端开发利器

2020-05-07 09:02:55

代码Python开发

2021-09-28 14:40:03

Python内置库itertools

2018-01-25 14:53:20

iPhone技巧删除照片

2015-10-27 10:12:21

r语言命令相见恨晚

2017-06-01 09:34:55

R语言包sqldf

2016-12-09 12:50:36

Android

2018-02-07 14:54:17

Riverbed应用性能管理数字体验

2009-02-20 13:12:23

unixSolaris初学者

2019-12-02 10:16:45

Linux 开源操作系统

2019-08-29 09:10:11

Linux命令编程语言

2020-11-23 21:23:34

办公

2021-08-19 15:02:32

科技软件电脑

2021-04-20 10:47:59

手机APP科技

2019-08-09 14:13:22

Python知乎程序员

2019-02-12 11:22:29

Linux 系统 命令

2021-03-19 10:32:39

Python网站Python开源库

2020-10-30 07:09:52

Lombok架构师
点赞
收藏

51CTO技术栈公众号