"Key Takeaway"
为什么要定义私有成员变量
书接上文,我们提到,类成员变量通常是私有的。正在学习面向对象编程的开发人员通常很难理解这么做的目的。其实打个比方你就能够明白了。
生活中我们可以接触到许多电子设备。例如电视遥控器,你可以用它来打开/关闭电视。你可以开车(或踏板车)去上班,用智能手机拍照。这三种看似不相关的东西却有着一个共同的模式:它们为你提供一个简单的界面使你可以(一个按钮、一个方向盘等等……)执行一个动作。然而,这些设备的实际操作方式却不为你所知。当你按下遥控器上的按钮时,你不需要知道它是如何与电视通信的。当你踩油门时,你也不需要知道内燃机是如何让轮子转动的。当你拍照时,你不需要知道传感器是如何将光线聚集成像素图像的。这种接口和实现的分离非常有用,因为它允许我们在不了解物体如何工作的情况下使用物体。这极大地降低了使用这些对象的复杂性,增加了我们能够与之交互的对象数量。
基于同样的原因,将实现和接口分离在软件工程中也是非常有用的。
封装
在面向对象编程中,封装(有时也称为信息屏蔽)是指将对象的实现细节对用户隐藏起来的过程。用户在使用对象的时候只需要通过公开接口访问对象即可。通过这种方式,用户可以在不了解对象实现的情况下使用该对象。
在 C++ 中,我们可以通过成员访问修饰符来实现封装。通常,类的所有成员变量都是私有的(隐藏实现细节),而大多数成员函数都是公有的(暴露接口)。虽然要求类的用户使用公开接口与类交互比直接提供对成员变量的公共访问更繁琐,但这样做实际上益处颇多,有助于提高类的可重用性和可维护性。
注意:封装一词有时候也指代对数据和函数的打包。这里我们只取其在面向对象编程中的含义。
好处 1 :类封装可以提高其易用性并降低程序复杂度
对于一个良好封装的类来说,你只需关心该类为你提供了哪些公共接口,这些接口需要什么参数,它们的返回值是什么。而这个类的具体内部实现则完全不需要搞清楚。例如,类中保存了一个包含多个名字的列表,而这个列表的实现可以是包含C语言风格字符串的动态数组,也可以是 std::array
、std::vector
、std::map
、std::list
或者其他数据结构。在使用该类的对象时,不需要也不关心它使用了哪个数据结构来保存名字。这无疑极大程度地降低了你的程序的复杂度,也就减少了犯错误的机会。与其他的好处相比,这是封装带来的最大好处。
C++ 标准库中的所有类都是封装过的。你可以想象一下,如果你需要了解 std::string
, std::vector
或 std::cout
的实现才能使用它们的话,将是多么可怕的一件事!
好处 2 :类封装可以保护其数据不被滥用
全局变量是危险的,因为你不能严格控制谁可以访问全局变量,或者他们应该如何使用它。公有成员也有同样的问题,只是程度稍轻而已。
例如,假设我们正在编写一个字符串类。我们可以这样开始:
class MyString
{
char* m_string; // we'll dynamically allocate our string here
int m_length; // we need to keep track of the string length
};
这两个变量存在内在的联系: m_length
应该总是等于 m_string
持有的字符串的长度(这种联系被称为不变量)。如果 m_length
是public 的,那么任何人都可以在不改变 m_string
的情况下改变字符串的长度(反之亦然)。这将使类处于不一致的状态,从而可能导致各种奇怪的问题。通过使 m_length
和 m_string
成为 private ,用户被迫使用任何可用的公共成员函数与该类进行交互(并且这些成员函数可以确保 m_length
和 m_string
总是被适当设置)。
我们还可以防止用户在使用我们的类时犯错误。考虑一个具有公共数组成员变量的类:
class IntArray
{
public:
int m_array[10];
};
如果用户可以直接访问数组,他们可能会使用无效的索引下标数组,从而引发意想不到的结果:
int main()
{
IntArray array;
array.m_array[16] = 2; // invalid array index, now we overwrote memory that we don't own
}
然而,如果我们将数组设为私有,则可以强制调用一个验证索引是否有效的函数:
#include <iterator> // For std::size()
class IntArray
{
private:
int m_array[10]; // user can not access this directly any more
public:
void setValue(int index, int value)
{
// If the index is invalid, do nothing
if (index < 0 || index >= std::size(m_array))
return;
m_array[index] = value;
}
};
通过这种方式可以保护程序的完整性。顺带一提,std::array
和 std::vector
的 at()
函数所做的事情和上面的函数非常类似!
好处 3 :封装过的类更容易修改
考虑下面这个简单的类:
#include <iostream>
class Something
{
public:
int m_value1;
int m_value2;
int m_value3;
};
int main()
{
Something something;
something.m_value1 = 5;
std::cout << something.m_value1 << '\n';
}
虽然这个程序工作得很好,但如果稍后我们决定重命名 m_value1
或改变它的类型会发生什么?我们不仅破坏了这个程序,而且可能破坏了大多数使用 Something
类的程序!
封装使我们能够在不破坏所有使用类的程序的情况下改变类的实现方式。
下面是这个类的封装版本,它使用函数访问 m_value1
:
#include <iostream>
class Something
{
private:
int m_value1;
int m_value2;
int m_value3;
public:
void setValue1(int value) { m_value1 = value; }
int getValue1() { return m_value1; }
};
int main()
{
Something something;
something.setValue1(5);
std::cout << something.getValue1() << '\n';
}
现在,让我们改变类的实现:
#include <iostream>
class Something
{
private:
int m_value[3]; // note: we changed the implementation of this class!
public:
// We have to update any member functions to reflect the new implementation
void setValue1(int value) { m_value[0] = value; }
int getValue1() { return m_value[0]; }
};
int main()
{
// But our program still works just fine!
Something something;
something.setValue1(5);
std::cout << something.getValue1() << '\n';
}
请注意,因为我们没有更改类的公共接口中的任何函数签名(返回类型、函数名或形参),所以使用该类的用户不会感知到任何改变。
同样地,如果有人在晚上潜入你的房子,用不同的(但兼容的)技术替换了你的电视遥控器的内部,你在使用时可能完全不会注意到!
好处 4:封装的类更容易查找错误
最后,封装可以帮助你在出现错误时调试程序。通常,当一个程序不能正常工作时,其原因可能是因为我们的一个成员变量的值不正确。如果每个人都能够直接访问变量,那么跟踪哪段代码修改了变量就会很困难(可能是程序中的任何一段代码,你需要将它们全部分解以找出是哪一行)。但是,如果每个人都必须调用同一个公共函数来修改一个值,那么你就可以将该函数设为断点,并观察每个调用者更改值的过程,直到发现哪里出了问题。
成员访问函数
对于某些类来说(取决于这个类要做什么),有时候我们会希望能够直接读取或设置某个私有成员变量的值。
成员访问函数是一类用于获取或改变类私有成员变量值的精简函数。例如,对于 String
类,成员函数看上去可能会像这样:
class MyString
{
private:
char* m_string; // we'll dynamically allocate our string here
int m_length; // we need to keep track of the string length
public:
int getLength() { return m_length; } // access function to get value of m_length
};
getLength()
就是上一个成员访问函数,它返回 m_length
的值。
成员访问函数通常有两种:getters 和 setters。Getters (有时也称为accessor) 用于返回某个私有成员变量的值。Setters (有时候也称为mutators) 则用于为私有成员变量设置值。
下面是一个示例类,它的所有成员都具有 getter 和 setter :
class Date
{
private:
int m_month;
int m_day;
int m_year;
public:
int getMonth() { return m_month; } // getter for month
void setMonth(int month) { m_month = month; } // setter for month
int getDay() { return m_day; } // getter for day
void setDay(int day) { m_day = day; } // setter for day
int getYear() { return m_year; } // getter for year
void setYear(int year) { m_year = year; } // setter for year
};
Date 类本质上是一个封装过的结构,使用者有理由认为它们能够读取和设置类中的年月日变量。
MyString
类不仅包含数据——它有更复杂的功能,并且有一个需要维护的不变量。我们没有为变量 m_length
提供 setter,因为我们不希望用户能够直接设置字符串的(长度应该只在字符串发生更改时设置)。在这个类中,用户可以直接获取字符串长度是有意义的,因此提供了获取长度值的getter。
getter应该提供对数据的“只读”访问。因此,最佳实践是它们应该通过值或const引用(而不是通过非const引用)返回。返回非const引用的getter将允许调用者修改被引用的实际对象,这违反了getter的只读特性(并违反了封装)。
下面的例子展示了当getter返回一个非const引用时会发生什么:
#include <iostream>
class Foo
{
private:
int m_value{ 4 };
public:
int& getValue() { return m_value; } // returns a non-const reference
};
int main()
{
Foo f; // f.m_value is initialized to 4
f.getValue() = 5; // use the non-const reference to assign value 5 to m_value
std::cout << f.getValue(); // prints 5
return 0;
}
运行结果为:
5
因为 getValue()
返回的是一个非const类型的引用,因此我们可以通过该引用直接修改被其引用的对象(m_value
)!
"最佳实践"
getter 应该按值返回或返回const引用。
成员访问函数的相关问题
在哪些情况下应该使用访问函数,哪些情况下应该避免访问函数,对此有相当多的讨论。尽管访问函数不违反封装原则,但一些开发人员认为使用访问函数不是良好的OOP类设计(这个主题可以写一本书来讨论)。
当下,我们将推荐一种实用的方法。在创建类时,请考虑以下几点:
- 如果不需要从类的外部访问成员,不要为该成员提供访问函数;
- 如果需要从外部访问成员,考虑是否可以通过某种行为或动作来完成(例如,与其提供
setAlive(bool)
setter,不如实现一个kill()
函数) - 如果可以,仅考虑提供一个getter
小结
正如您所看到的,实现封装并不会很麻烦,其带来的好处却非常的多。封装的主要好处是允许用户在不了解类的内部实现的情况下,轻松地使用该类。÷