Spark数据分析:表操作指南

本节介绍在Spark中对表进行的各种操作,包括修改、删除和重命名。

1. 修改表结构

  • 修改字段类型: 使用 ALTER TABLE 语句和 MODIFY 关键字可以更改现有字段的数据类型。

    sql

    ALTER TABLE student MODIFY age INT;

  • 重命名字段: 使用 ALTER TABLE 语句和 RENAME COLUMN 关键字可以更改现有字段的名称。

    sql

    ALTER TABLE table2 RENAME COLUMN result TO result2;

  • 添加字段: 使用 ALTER TABLE 语句和 ADD 关键字可以向现有表添加新字段。

    sql

    ALTER TABLE emp1 ADD sal DECIMAL(10,2);

  • 删除字段: 使用 ALTER TABLE 语句和 DROP COLUMN 关键字可以从现有表中删除字段。

    sql

    ALTER TABLE student DROP COLUMN age;

    ALTER TABLE emp1 DROP COLUMN sal;

2. 处理表数据

  • 清空表: 使用 TRUNCATE TABLE 语句可以快速删除表中的所有数据。请注意,此操作不可逆,请谨慎操作。 sql TRUNCATE TABLE student;

3. 表级别操作

  • 删除表: 使用 DROP TABLE 语句可以完全删除一个表及其所有数据。

    sql

    DROP TABLE student;

  • 重命名表: 使用 RENAME 语句可以更改现有表的名称。

    sql

    RENAME student TO student1;

    RENAME emp1 TO emp2;

4. 实践练习

以下是一些练习,可以帮助您巩固对上述表操作的理解:

  1. scott 模式下创建一个名为 emp1 的表,包含以下字段:

    • empno: 数值类型,长度为10
    • ename: 字符串类型,长度为50

    sql

    CREATE TABLE emp1 (

    empno INT,

    ename VARCHAR(50)

    );

  2. emp1 表添加一个名为 sal 的字段,数据类型为数值型,长度为10,小数位数为2。

  3. emp1 表中 ename 字段的长度修改为100。

  4. 删除 emp1 表中的 sal 字段。

  5. 将表 emp1 重命名为 emp2