Pandas数据分析工具
1
Pandas快速入门

这是一个Pandas快速入门教程,主要面向新用户。 这里主要是为那些喜欢“短平快”的读者准备的,有兴趣的读者可通过其它教程文章来一步一步地更复杂的应用知识。 首先,假设您安装好了 Pandas。 测试工作环境是否有安装好了Pandas,导…

2025-02-3

2
Pandas 序列(Series)

Pandas 中序列(Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。 轴标签统称为索引。这个概念与字典有点类似。 创建Pandas序列 Pandas序列可以使用以下构造函数创建 - pa…

2025-03-27

3
Pandas数据帧(DataFrame)

数据帧(DataFrame)是二维数据结构,即数据以行和列的表格方式排列。 可以视为 SQL 表或电子表格数据表示。 数据帧(DataFrame)的功能特点: 潜在的列是不同的类型 大小可变 标记轴(行和列) 可以对行和列执行算术运算 …

2023-07-12

4
Pandas基本功能

到目前为止,我们了解了三种Pandas数据结构以及如何创建它们。接下来将主要关注数据帧(DataFrame)对象,因为它在实时数据处理中非常重要,并且还讨论其他数据结构。 系列基本功能 编号 属性或方法 描述 1 axes …

2025-03-27

5
Pandas描述性统计

有很多方法用来集体计算DataFrame的描述性统计信息和其他相关操作。 其中大多数是sum(),mean()等聚合函数,但其中一些,如sumsum(),产生一个相同大小的对象。 一般来说,这些方法采用轴参数,就像ndarray.{sum…

2023-12-16

6
Pandas函数应用

要将自定义或其他库的函数应用于Pandas对象,有三个重要的方法,下面来讨论如何使用这些方法。使用适当的方法取决于函数是否期望在整个DataFrame,行或列或元素上进行操作。 表合理函数应用:pipe() 行或列函数应用:apply(…

2025-01-27

7
Pandas重建索引

重新索引会更改DataFrame的行标签和列标签。重新索引意味着符合数据以匹配特定轴上的一组给定的标签。 可以通过索引来实现多个操作 - 重新排序现有数据以匹配一组新的标签。 在没有标签数据的标签位置插入缺失值( NA )标记。 示例…

2025-03-27

8
Pandas迭代

Pandas对象之间的基本迭代的行为取决于类型。当迭代一个系列时,它被视为数组式,基本迭代产生这些值。其他数据结构,如:DataFrame和Panel,遵循类似惯例迭代对象的键。 简而言之,基本迭代(对于i在对象中)产生 - Serie…

2025-02-8

9
Pandas排序

Pandas有两种排序方式,它们分别是 - 按标签 按实际值 下面来看看一个输出的例子。 在 unsorted_df 数据值中,标签和值未排序。下面来看看如何按标签来排序。 按标签排序 使用 sort_index() 方法,通过传递 …

2025-02-8

10
Pandas字符串和文本数据

在本章中,我们将使用基本系列/索引来讨论字符串操作。在随后的章节中,将学习如何将这些字符串函数应用于数据帧(DataFrame)。 Pandas提供了一组字符串函数,可以方便地对字符串数据进行操作。 最重要的是,这些函数忽略(或排除)丢失…

2025-02-8

11
Pandas选项和自定义

Pandas提供API来自定义其行为的某些方面,大多使用来显示。 API由五个相关函数组成。它们分别是 - get_option() set_option() reset_option() describe_option() optio…

2025-02-8

12
Pandas索引和选择数据

除了基于纯标签和整数之外,Pandas还提供了一种使用运算符进行选择和子集化对象的混合方法。 可以使用 loc() 函数或 iloc() 函数。 在旧版本中使用的是 ix ,现在已经被弃用。 loc 从索引中获取具有特定标签的行(或…

2025-02-8

13
Pandas统计函数

统计方法有助于理解和分析数据的行为。现在我们将学习一些统计函数,可以将这些函数应用到Pandas的对象上。 pct_change()函数 系列,DatFrames和Panel都有pct_change()函数。此函数将每个元素与其前一个元素…

2025-02-8

14
Pandas窗口函数

为了处理数字数据,Pandas提供了几个变体,如滚动,展开和指数移动窗口统计的权重。 其中包括总和,均值,中位数,方差,协方差,相关性等。 下面来学习如何在DataFrame对象上应用上提及的每种方法。 .rolling() 函数 这个函…

2025-02-8

15
Pandas聚合

当有了滚动,扩展和ewm对象创建了以后,就有几种方法可以对数据执行聚合。 DataFrame应用聚合 让我们创建一个DataFrame并在其上应用聚合。 可以通过向整个DataFrame传递一个函数来进行聚合,或者通过标准的获取项目方法来…

2025-02-8

16
Pandas缺失数据

数据丢失(缺失)在现实生活中总是一个问题。 机器学习和数据挖掘等领域由于数据缺失导致的数据质量差,在模型预测的准确性上面临着严重的问题。 在这些领域,缺失值处理是使模型更加准确和有效的重点。 想象一下有一个产品的在线调查。很多时候,人们不…

2025-02-8

17
Pandas分组(GroupBy)

任何分组(groupby)操作都涉及原始对象的以下操作之一。它们是 - 分割对象 应用一个函数 结合的结果 在许多情况下,我们将数据分成多个集合,并在每个子集上应用一些函数。在应用函数中,可以执行以下操作 - 聚合 - 计算汇总统计 …

2025-02-8

18
Pandas合并/连接

Pandas具有功能全面的高性能内存中连接操作,与SQL等关系数据库非常相似。 Pandas提供了一个单独的merge()函数,作为DataFrame对象之间所有标准数据库连接操作的入口 - pd.merge(left, right, h…

2025-02-2

19
Pandas级联

Pandas提供了各种工具(功能),可以轻松地将Series,DataFrame和Panel对象组合在一起。 pd.concat(objs,axis=0,join='outer',join_axes=None, ignor…

2025-02-8

20
Pandas日期功能

日期功能扩展了时间序列,在财务数据分析中起主要作用。在处理日期数据的同时,我们经常会遇到以下情况 - 生成日期序列 将日期序列转换为不同的频率 创建一个日期范围 通过指定周期和频率,使用 date.range() 函数就可以创建日期序…

2025-02-8

阅读使用手册


平台的登录与使用,请参考 《用户使用手册》


注册用户账号


若尚未开通科学计算平台使用权限,请 注册用户账号


登陆


第三方账号登录




介绍

为了方便学习Python语言,基于Jupyter技术栈搭建了在线计算环境。 用户使用时以网页形式打开,对照书中内容进行学习,在线编写代码和运行代码,代码的运行结果也会直接显示。如在编程过程中需要编写说明文档,可在同一个页面直接编写,便于作及时的说明和解释。

在数据科学、机器学习及深度学习的领域里,Jupyter是一个强大的工具,它集成了代码编写、可视化展示、文档记录等多种功能于一体,让科学计算变得既直观又高效。 随着数据科学和人工智能领域的不断发展,Jupyter 也在不断更新和完善其功能和性 能。 未来可以期待看到更多创新的特性和工具被加入到 Jupyter 中,从而进一步推动科学计算和数据分析的发展。





平台内核

目前平台提供配置好的计算时内核供运行使用。后期会根据需求增加公用内核及内核中的默认类库。 相关语言运行环境与类库一般由 Conda 库提供最新版本。

  • Python 3.11 [系统]
  • Python 3.12 [Conda]
  • R 4.4 [Conda]


注意事项

  • 平台使用Jupyter技术搭建,登陆认证使用本系统的注册账号。
  • 使用提供一定数量的硬盘空间存储供用户使用。目前限制为 500M 。
Copyright © 在线编程学习实验平台 Since 2025. 工信部ICP备案:吉ICP备2025024314号