登录 |
  • 注册
  • class的设计原则

    2009年07月17日 下午 20:59 | 作者:pangyt

    转自:http://c.chinaitlab.com/cc/basic/200806/753989.html
     面向对象编程对于产出高质量,易维护的代码是非常有帮助的。面向对象编程的概念构建于三个基本特征之上:封装,继承,多态。在C++中,class是面向对象编程概念的核心和具体形式。class通过私有成员体现“封装”,通过直接继承或者组合体现“继承”,通过虚函数和动态绑定(dynamic binding)体现“多态”。class的设计质量直接决定了整个系统的质量。
      从整体功能层面谈class设计,有这么三条原则:

      ·单一功能原则(Single Responsibility Principle)
      一个class就其整体应该只提供单一的服务。如果一个class提供多样的服务,那么就应该把它拆分,反之,如果一个在概念上单一的功能却由几个class负责,这几个class应该合并。

      ·开放/封闭原则(Open/Close Principle)
      一个设计并实现好的class,应该对扩充的动作开放,而对修改的动作封闭。也就是说,这个class应该是允许扩充的,但不允许修改。如果需要功能上的扩充,一般来说应该通过添加新类实现,而不是修改原类的代码。添加新类不单可以通过直接继承,也可以通过组合。

      ·最小惊讶原理(Least Surprise Principle)
      在重载函数,或者子类实现父类虚函数时,应该基本维持函数原来所期望的功能。比如:
    class Pet {
     public:
      virtual Talk() = 0;
    };
    class Cat : public Pet {
     public:
      void Talk() { cout << “miao”; }
    };
    class Dog : public Pet {
     public:
      void Talk() { BiteOwner(); }
    };
      class Dog 在实现虚函数Talk的时候,没有像我们期望的那样输出狗吠声,而是咬起主人来了。这是应该避免的。

      接口和实现
      在系统中,观察一个class有两个角度,从外部或者用户角度我们看到的是接口,从内部我们看到的是实现。因为系统肯定要不断修改,因此实现免不了不停的变化,但是接口又被要求尽量保持稳定。这两者的矛盾必须通过良好的设计尽量避免,基本原则就是将实现细节与接口隔离。下面列出几条比较具体点的:

      ·接口的设计保持最小而完整
      精简接口函数个数,使每一个函数有代表性,函数功能恰好覆盖class的职能。一个最小的接口可以使维护简单,增加潜在的代码重用性,减少客户的迷惑,并且也可以缩小头文件长度和编译时间。当改进函数时,应该用类似函数名实现改进而保留原函数,代码注释里应该有相应的说明。可以增加新函数,但不能删除旧函数。

      ·成员变量应该都为私有
      显而易见,public变量破坏封装性以及接口和实现的分离;protected变量也可能使客户编写继承类而依赖于父类的实现细节。

      ·避免函数返回成员变量的指针或引用
      这么做也会使客户代码依赖于实现细节。

      ·考虑是否禁用编译器缺省产生的函数
      这些函数包括:复制构造函数,赋值操作符(operator =)。如果我们不打算定义自己的版本而不禁用默认版本的话,可能使客户代码在不注意的情况下调用这些函数。当实现发生改动时就可能引起问题,比如 class多了一个heap memory指针。如果我们允许对象拷贝,比较稳妥的方法是禁用它们,而定义一个专门的clone()函数。

      兼容性(compatibility)
      代码兼容可以简单分为二进制兼容和源代码兼容。二进制兼容也就是说,客户的已编译代码可以在不用重新编译的情况下,直接使用你的不同版本的已编译代码。源代码兼容就是,如果你的代码更新了,客户的代码不需要修改,只需要重新编译就可正常运行。在C++中,接口一般是由头文件和library二进制代码提供,因此,任何可能造成library代码和旧的头文件不一致的情况都可能破坏二进制兼容,因为客户代码必须和新的头文件重新编译一次。

      因此,遵循几条准则可以使你更轻松地解决兼容性问题:
     
     ·不改变类的大小或者改变成员变量的顺序
      包括几个方面:不增加或减少成员变量;不修改成员变量类型;不改变成员变量的声明顺序;不改变虚函数的有无。显而易见,增加或减少成员变量会改变类的大小,并且需要更新头文件,从而可能造成与客户代码不兼容。类型的变化也可能引起类的大小的变化。成员变量的访问一般是由编译器按偏移量确定,顺序如果改变,偏移量也就会改变,破坏了二进制兼容。至于虚函数的有无,决定是否存在虚函数表指针,也就影响了类的大小和成员变量的顺序。

      ·不使用inline函数
      inline函数声明于头文件中,并且被编译于客户代码中,如果inline函数访问了private成员,该成员又改变了顺序,那么inline函数虚要被重新编译,破坏了二进制兼容。

      ·接口函数不使用虚函数
      虚函数的访问和成员变量类似,是通过虚函数表中的偏移。虚函数顺序的改变会影响偏移。因此,在条件允许时,应该避免使用public虚函数。比如:

    class Picture {
     public:
      virtual void Draw();
    };
      应该改为

    class Picture {
     public:
      void Draw();
     private:
      virtual void DoDraw();
    };
    void Picture::Draw()
    {
     DoDraw();
    }
      ·不改变接口函数的顺序
      在很多嵌入式系统中,链接库通过输出函数表(eXPorted function table)暴露接口以节省空间。此时,对接口函数的访问也是通过索引值进行,因此改变顺序也会破坏兼容性。

      ·避免使用函数缺省参数
      给函数形参设定缺省值可以方便客户,但是可能破坏兼容。缺省值随头文件给出,缺省值的改变也就会引起兼容问题。

    书签类网站的数据库设计

    2009年07月7日 下午 42:00 | 作者:pangyt

    最近需要做一个有标签功能的web应用,需要考虑数据库的设计,搜集了一些资料,个人想法暂时按下不表。
    http://www.pui.ch/phred/
    http://icyleaf.com/2008/06/21/tags-database-schemas/

    mysql explain

    2009年07月2日 下午 24:34 | 作者:pangyt

    【转】
    http://www.cnitblog.com/aliyiyi08/archive/2008/09/09/48878.html

    Mysql Explain 详解

    一.语法

    explain < table_name >

    例如: explain select * from t3 where id=3952602;

    二.explain输出解释

    +—-+————-+——-+——-+——————-+———+———+——-+——+——-+
    | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
    +—-+————-+——-+——-+——————-+———+———+——-+——+——-+

    1.id
    我的理解是SQL执行的顺利的标识,SQL从大到小的执行.

    例如:
    mysql> explain select * from (select * from ( select * from t3 where id=3952602) a) b;
    +—-+————-+————+——–+——————-+———+———+——+——+——-+
    | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
    +—-+————-+————+——–+——————-+———+———+——+——+——-+
    | 1 | PRIMARY | | system | NULL | NULL | NULL | NULL | 1 | |
    | 2 | DERIVED | | system | NULL | NULL | NULL | NULL | 1 | |
    | 3 | DERIVED | t3 | const | PRIMARY,idx_t3_id | PRIMARY | 4 | | 1 | |
    +—-+————-+————+——–+——————-+———+———+——+——+——-+

    很显然这条SQL是从里向外的执行,就是从id=3 向上执行.

    2. select_type

    就是select类型,可以有以下几种

    (1) SIMPLE
    简单SELECT(不使用UNION或子查询等) 例如:
    (2). PRIMARY
    我的理解是最外层的select.例如:
    (3).UNION
    UNION中的第二个或后面的SELECT语句.例如
    (4).DEPENDENT UNION
    UNION中的第二个或后面的SELECT语句,取决于外面的查询
    (4).UNION RESULT
    UNION的结果。
    (5).SUBQUERY
    子查询中的第一个SELECT.
    (6). DEPENDENT SUBQUERY
    子查询中的第一个SELECT,取决于外面的查询
    (7).DERIVED
    派生表的SELECT(FROM子句的子查询)

    3.table
    显示这一行的数据是关于哪张表的.
    有时不是真实的表名字,看到的是derivedx(x是个数字,我的理解是第几步执行的结果)

    4.type

    这列很重要,显示了连接使用了哪种类别,有无使用索引.
    从最好到最差的连接类型为const、eq_reg、ref、range、indexhe和ALL

    (1).system
    这是const联接类型的一个特例。
    (2).const
    表最多有一个匹配行,它将在查询开始时被读取。因为仅有一行,在这行的列值可被优化器剩余部分认为是常数。const表很快,因为它们只读取一次!

    const用于用常数值比较PRIMARY KEY或UNIQUE索引的所有部分时。
    (3). eq_ref

    对于每个来自于前面的表的行组合,从该表中读取一行。
    (4).ref

    对于每个来自于前面的表的行组合,所有有匹配索引值的行将从这张表中读取。
    (5). ref_or_null
    该联接类型如同ref,但是添加了MySQL可以专门搜索包含NULL值的行。在解决子查询中经常使用该联接类型的优化。
    (6). index_merge
    该联接类型表示使用了索引合并优化方法。在这种情况下,key列包含了使用的索引的清单,key_len包含了使用的索引的最长的关键元素。

    (7). unique_subquery
    该类型替换了下面形式的IN子查询的ref:

    value IN (SELECT primary_key FROM single_table WHERE some_expr)
    unique_subquery是一个索引查找函数,可以完全替换子查询,效率更高。

    (8).index_subquery

    该联接类型类似于unique_subquery。可以替换IN子查询,但只适合下列形式的子查询中的非唯一索引:

    value IN (SELECT key_column FROM single_table WHERE some_expr)

    (9).range

    只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引。key_len包含所使用索引的最长关键元素。在该类型中ref列为NULL。
    (10).index
    该联接类型与ALL相同,除了只有索引树被扫描。这通常比ALL快,因为索引文件通常比数据文件小。
    当查询只使用作为单索引一部分的列时,MySQL可以使用该联接类型。
    (11). ALL
    对于每个来自于先前的表的行组合,进行完整的表扫描。如果表是第一个没标记const的表,这通常不好,并且通常在它情况下很差。通常可以增加更多的索引而不要使用ALL,使得行能基于前面的表中的常数值或列值被检索出。
    5.possible_keys
    possible_keys列指出MySQL能使用哪个索引在该表中找到行。注意,该列完全独立于EXPLAIN输出所示的表的次序。这意味着在possible_keys中的某些键实际上不能按生成的表次序使用。

    如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查WHERE子句看是否它引用某些列或适合索引的列来提高你的查询性能。如果是这样,创造一个适当的索引并且再次用EXPLAIN检查查询

    6. key
    key列显示MySQL实际决定使用的键(索引)。如果没有选择索引,键是NULL。要想强制MySQL使用或忽视possible_keys列中的索引,在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。

    7.key_len
    key_len列显示MySQL决定使用的键长度。如果键是NULL,则长度为NULL。
    使用的索引的长度。在不损失精确性的情况下,长度越短越好

    8. ref
    ref列显示使用哪个列或常数与key一起从表中选择行。

    9. rows
    rows列显示MySQL认为它执行查询时必须检查的行数。

    10. Extra
    该列包含MySQL解决查询的详细信息,下面详细.

    (1).Distinct
    一旦MYSQL找到了与行相联合匹配的行,就不再搜索了

    (2).Not exists
    MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行,

    就不再搜索了

    (3).Range checked for each

    Record(index map:#)
    没有找到理想的索引,因此对于从前面表中来的每一个行组合,MYSQL检查使用哪个索引,并用它来从表中返回行。这是使用索引的最慢的连接之一

    (4).Using filesort
    看到这个的时候,查询就需要优化了。MYSQL需要进行额外的步骤来发现如何对返回的行排序。它根据连接类型以及存储排序键值和匹配条件的全部行的行指针来排序全部行

    (5).Using index
    列数据是从仅仅使用了索引中的信息而没有读取实际的行动的表返回的,这发生在对表的全部的请求列都是同一个索引的部分的时候

    (6).Using temporary
    看到这个的时候,查询需要优化了。这里,MYSQL需要创建一个临时表来存储结果,这通常发生在对不同的列集进行ORDER BY上,而不是GROUP BY上

    (7).Using where
    使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。如果不想返回表中的全部行,并且连接类型ALL或index,这就会发生,或者是查询有问题

    mysql的字符集和校验规则的概念

    2009年07月2日 下午 10:00 | 作者:pangyt

    【转】
    作者:淘宝DBA team blog
    URL:http://rdc.taobao.com/blog/dba/html/180_mysql_characterset_collation_concept.html
    刚刚接触mysql的人(like me),可能对这2个概念不是太理解,这里小小解释一下,希望能说明清楚这个问题。
    字符集,character set,就是一套表示字符的符号和这些的符号的底层编码;而校验规则,则是在字符集内用于比较字符的一套规则。字符集还是比较容易理解的,主要是校验规则,下面我简单举个例子来说明一下:
    如在某个字符集“X”的A与a,他们的底层编码分别是A=0,a=100。这里符号“A”“a”和底层编码“0”“100”就是字符集的概念范围。假设我们要比较A与a的大小,我们得到a>A,因为我们是根据其底层编码进行比较的,这就是这个字符集“X”的一种校验规则“Z”(根据底层编码来比较)。假设,现在有另外一种校验规则,是先取其相反数,然后再比较大小,那么就很显然的得到a

    关于字符集与校验规则,mysql能:

    1、使用字符集来存储字符串,支持多种字符集;
    2、使用校验规则来比较字符串,同种字符集还能使用多种校验规则来比较;
    3、在同一台服务器、同一个数据库或者甚至在同一个表中使用不同字符集或校对规则来混合组合字符串;
    4、可以在任何级别(服务器、数据库、表、字段、字符串),定义不同的字符集和校验规则。

    查询你的mysql数据库所支持的字符集种类,可以如下:
    mysql> show character set;
    +———-+—————————–+———————+——–+
    | Charset | Description | Default collation | Maxlen |
    +———-+—————————–+———————+——–+
    | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
    | dec8 | DEC West European | dec8_swedish_ci | 1 |
    | ………| …………………. | ……………. | . |
    | eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
    +———-+—————————–+———————+——–+
    36 rows in set (0.00 sec)

    这里的maxlen表示要用最大多少个字节来存储字符集的单个词,default collation表示该字符集的默认校验规则。
    你也可以利用like来进行筛选,如下:
    mysql> show character set like ‘latin%’;
    +———+—————————–+——————-+——–+
    | Charset | Description | Default collation | Maxlen |
    +———+—————————–+——————-+——–+
    | latin1 | cp1252 West European | latin1_swedish_ci | 1 |
    | latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
    | latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
    | latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
    +———+—————————–+——————-+——–+
    4 rows in set (0.00 sec)

    查询你的mysql数据库所支持字符集的校验规则,可以如下:
    mysql> show collation;
    +———————-+———-+—–+———+———-+———+
    | Collation | Charset | Id | Default | Compiled | Sortlen |
    +———————-+———-+—–+———+———-+———+
    | big5_chinese_ci | big5 | 1 | Yes | Yes | 1 |
    | big5_bin | big5 | 84 | | Yes | 1 |
    | dec8_swedish_ci | dec8 | 3 | Yes | | 0 |
    | …….. | …. | .. | … | … | . |
    | eucjpms_bin | eucjpms | 98 | | Yes | 1 |
    +———————-+———-+—–+———+———-+———+
    127 rows in set (0.00 sec)

    这里compiled表示该collation所对应的character set是否被编译到此mysql数据库,通过此点就可以知道该mysql数据库是否支持某个字符集。sortlen表示要在内存中排序时,该字符集的字符要占用多少个字节。
    你也可以利用like来进行筛选,如下:
    mysql> show collation like ‘latin1%’;
    +——————-+———+—-+———+———-+———+
    | Collation | Charset | Id | Default | Compiled | Sortlen |
    +——————-+———+—-+———+———-+———+
    | latin1_german1_ci | latin1 | 5 | | Yes | 1 |
    | latin1_swedish_ci | latin1 | 8 | Yes | Yes | 1 |
    | latin1_danish_ci | latin1 | 15 | | Yes | 1 |
    | latin1_german2_ci | latin1 | 31 | | Yes | 2 |
    | latin1_bin | latin1 | 47 | | Yes | 1 |
    | latin1_general_ci | latin1 | 48 | | Yes | 1 |
    | latin1_general_cs | latin1 | 49 | | Yes | 1 |
    | latin1_spanish_ci | latin1 | 94 | | Yes | 1 |
    +——————-+———+—-+———+———-+———+
    8 rows in set (0.00 sec)

    大家可能已经发现collation的名字似乎有规律可循,其实的确也是这样的,并且它也有些特征,如下:
    1、两个不同的字符集不能有相同的校验规则(字符集:校验规则 = 1:n);
    2、每个字符集都有一个校验规则,就是对应的DEFAULT=YES的那个collation;
    3、collation命名规则:字符集名_对应的语言名_ci/cs/bin,其中ci表示大小写不敏感性,cs表示大小写敏感性,bin表示二进制。