10.1 - 程序定义类型简介
Key Takeaway
- 自定义类型指代所有非C++核心类型,包括标准库
- 程序定义类型才指代编写当前程序时用户定义的类型
- 类型定义在某种程度上是不受限于单一定义规则的:类型的定义可以出现在多个代码文件中。因为编译器必须看到完整类型定义才能工作(确定内存分配大小)。但是同一个文件中只能出现一次,这个是永恒的真理
基本数据类型是 C++ 语言的核心部分,设计它们的目的就是为了可以在需要时拿来就用。例如,当我们需要定义一个int
或者double
类型的时候,我们只需要:
1 2 |
|
对于那些由基本数据类型通过简单扩展而得到的复合数据类型也是一样的(包括函数、指针、引用和数组):
1 2 3 4 |
|
这些组合可以正确工作是因为C++语言已经知晓这些数据类型名(和符号)的含义——因此我们不必提供或导入其定义。
而对于使用类型别名(8.6 - typedef 和类型别名)的情况来说,类型别名使我们可以为一个已知类型定义一个新的名字,因此类型别名实际上向程序引入了一个新的标识符,所以类型别名必须先定义后使用:
1 2 3 4 5 6 7 8 9 10 11 |
|
如果没有对 length
定义,编译器将无法知道在我们使用它定义变量时知晓其含义。对length
的定义并没有创建一个新的对象——它只是告诉编译器 length
你稍后可以使用它定义变量。
用户定义类型是什么?
在 9.1 - 复合数据类型 一课中,我们曾经介绍过如何存储一个分数。对于分数来说,它包括分子和分母两个部分,而且它们之间是存在概念性联系的。在本节课中,我们会讨论使用两个整型分别表示分子分母可能带来的问题。
如果C++有能够表示分数的内建类型就好了——但可惜并没有。还有数百种其他可能有用的类型C++没有包含,因为它不可能预测人们可能需要的所有东西(更不用说实现和测试那些东西了)。
相反,C++提供了解决该问题的另外一种途径:允许我们在程序中创建全新的自定义类型!这样的类型通常称为用户定义类型(尽管我们认为术语程序定义类型更好——我们将在本课后面讨论其区别)。C++有两类复合类型可以实现这一点:枚举类型(包括无作用域枚举类型和有作用域枚举)和类类型(包括结构体、类和联合体)。
定义一个程序定义类型
就像类型别名一样,程序定义类型也必须先定义后使用。程序定义类型的定义称为类型定义。
尽管结构体还尚未介绍,但我们可以先从下面的例子中了解到,自定义类型Fraction
和该类型对象是如何初始化的。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
|
在本例中,我们使用struct
关键字来定义一个名为Fraction
的新程序定义类型(在全局作用域中,因此它可以在文件的其他地方使用)。这不会分配任何内存——它只是告诉编译器Fraction
是什么样子的,所以我们可以稍后再为Fraction
类型的对象分配内存。然后,在main()
内部,实例化(并初始化)一个名为f
的Fraction
类型变量。
类型定义总是以分号结尾。没有在类型定义的末尾包含分号是一个常见的程序员错误,而且这个错误很难调试,因为编译器通常会在类型定义后面的行报错。例如,如果你从上面例子的Fraction
定义(第8行)末尾删除分号,编译器可能会因为main()
的定义(第11行)报错。
注意
不要忘记以分号结束类型定义,否则编译器通常会在下一行代码中出错。
我们将在下一课(10.2 - 无作用域枚举类型中展示更多定义和使用程序定义类型的例子,并且我们将从10.5 - 结构体、成员和成员选择开始介绍结构体。
命名一个程序定义类型
按照惯例,自定义类型的名字应该以大写字母开头,而且不要添加任何的后缀(例如:Fraction
,而不是 fraction
,fraction_t
或者 Fraction_t
)。
最佳实践
以大写字母开始命名自定义类型,不要使用后缀。
由于类型名和变量名之间的相似性,新手程序员时常会觉得下面这样的变量定义令人困惑:
1 |
|
但这与其他类型的变量定义并没有什么区别:类型(Fraction
)在前(因为 Fraction
是大写的,我们知道它是一个自定义类型),然后是变量名(fraction
),然后是一个可选的初始化值。因为C++是区分大小写的,所以这里不存在命名冲突!
在多文件程序中使用程序定义类型
每个使用程序定义类型的代码文件在使用之前都需要看到完整的类型定义。前向声明是不够的。看到完整定义是必需的,因为编译器需要知道要为该类型的对象分配多少内存。
为了能将定义引入需要使用该类型定义的文件,自定义类型通常被定义在头文件中,然后使用 #included
导入任何需要该定义的文件。这些头文件通常和类型具有相同的名字(例如 Fraction
应该定义在Fraction.h
中)。
最佳实践
- 只在一个代码文件中使用的程序定义类型应该在该代码文件中尽可能靠近第一个使用点定义。
- 在多个代码文件中使用的程序定义类型应该在与程序定义类型同名的头文件中定义,然后根据需要在代码文件中使用
#include
。
下面是一个例子,如果我们把我们的Fraction
类型移动到一个头文件(名为Fraction.h
),这样它就可以包含在多个代码文件中:
Fraction.h | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
Fraction.cpp | |
---|---|
1 2 3 4 5 6 7 8 9 |
|
类型定义部分上豁免于单一定义原则
在课程 2.7 - 前向声明和定义中,我们讨论了单一定义规则(one-definition-rule),该规则要求每个函数和全局变量在每个程序中只有一个定义。要在不包含定义的文件中使用给定函数或全局变量,需要前向声明(通常通过头文件实现)。这是可行的,因为当涉及到函数和非constexpr变量时,编译器只需要声明就可以 ,然后链接器会将所需的东西都链接起来。
但是,这个做法并不适用于类型,因为编译器通常需要看到完整的类型定义才能使用给定的类型。我们必须能够将完整的类型定义导入到每个需要它的代码文件。
为此,类型定义在某种程度上是不受限于单一定义规则的:类型的定义可以出现在多个代码文件中。
其实你已经在不经意之间这么做了:如果程序有两个代码文件,且都#include <iostream>
,那么我们实际上将所有输入/输出类型定义都导入到了这两个文件中。
有两点需要注意。首先,类型定义在同一个文件中只能出现一次(这通常不是问题,因为头文件防卫式声明可以防止该问题出现)。其次,给定类型的所有类型定义必须相同,否则将导致未定义行为。
命名法:用户定义类型 vs 程序定义类型
术语“用户定义类型”(自定义类型)有时会出现在日常对话中,也会在C++语言标准中提到(但没有定义)。在非正式的对话中,这个术语往往意味着“你自己定义的类型”(如上面的分数类型例子)。有时这也包括类型别名。
然而,在C++语言标准的行文语境中,任何没有定义为核心C++语言一部分的类型(换句话说,非基本类型)都是用户定义类型。因此,在C++标准库中定义的类型(例如std::string
)理论上也算用户定义的类型,就像你自己定义的任何类型一样。
为了区别,C++ 20语言标准将术语“程序定义类型”定义为仅指代你自己定义的类型。当我们讨论这些类型时,更喜欢使用这个术语,因为它更加精确。
类型 | 含义 | 例子 |
---|---|---|
基本类型 | 内建于 C++ 语言的核心部分 | int , std::nullptr_t |
用户定义类型 | 非基础数据类型(非正式场合指代程序定义类型) | std::string , Fraction |
程序定义类型 | 用户自定义的类或枚举类型 | Fraction |