登录 |
  • 注册
  • 书签类网站的数据库设计

    2009年07月7日 下午 42:00 | 作者:pangyt

    最近需要做一个有标签功能的web应用,需要考虑数据库的设计,搜集了一些资料,个人想法暂时按下不表。

    http://www.pui.ch/phred/

    http://icyleaf.com/2008/06/21/tags-database-schemas/

    mysql explain

    2009年07月2日 下午 24:34 | 作者:pangyt

    【转】

    http://www.cnitblog.com/aliyiyi08/archive/2008/09/09/48878.html

    Mysql Explain 详解

    一.语法

    explain < table_name >

    例如: explain select * from t3 where id=3952602;

    二.explain输出解释

    +—-+————-+——-+——-+——————-+———+———+——-+——+——-+
    | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
    +—-+————-+——-+——-+——————-+———+———+——-+——+——-+

    1.id
    我的理解是SQL执行的顺利的标识,SQL从大到小的执行.

    例如:
    mysql> explain select * from (select * from ( select * from t3 where id=3952602) a) b;
    +—-+————-+————+——–+——————-+———+———+——+——+——-+
    | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
    +—-+————-+————+——–+——————-+———+———+——+——+——-+
    | 1 | PRIMARY | | system | NULL | NULL | NULL | NULL | 1 | |
    | 2 | DERIVED | | system | NULL | NULL | NULL | NULL | 1 | |
    | 3 | DERIVED | t3 | const | PRIMARY,idx_t3_id | PRIMARY | 4 | | 1 | |
    +—-+————-+————+——–+——————-+———+———+——+——+——-+

    很显然这条SQL是从里向外的执行,就是从id=3 向上执行.

    2. select_type

    就是select类型,可以有以下几种

    (1) SIMPLE
    简单SELECT(不使用UNION或子查询等) 例如:
    (2). PRIMARY
    我的理解是最外层的select.例如:
    (3).UNION
    UNION中的第二个或后面的SELECT语句.例如
    (4).DEPENDENT UNION
    UNION中的第二个或后面的SELECT语句,取决于外面的查询
    (4).UNION RESULT
    UNION的结果。
    (5).SUBQUERY
    子查询中的第一个SELECT.
    (6). DEPENDENT SUBQUERY
    子查询中的第一个SELECT,取决于外面的查询
    (7).DERIVED
    派生表的SELECT(FROM子句的子查询)

    3.table
    显示这一行的数据是关于哪张表的.
    有时不是真实的表名字,看到的是derivedx(x是个数字,我的理解是第几步执行的结果)

    4.type

    这列很重要,显示了连接使用了哪种类别,有无使用索引.
    从最好到最差的连接类型为const、eq_reg、ref、range、indexhe和ALL

    (1).system
    这是const联接类型的一个特例。
    (2).const
    表最多有一个匹配行,它将在查询开始时被读取。因为仅有一行,在这行的列值可被优化器剩余部分认为是常数。const表很快,因为它们只读取一次!

    const用于用常数值比较PRIMARY KEY或UNIQUE索引的所有部分时。
    (3). eq_ref

    对于每个来自于前面的表的行组合,从该表中读取一行。
    (4).ref

    对于每个来自于前面的表的行组合,所有有匹配索引值的行将从这张表中读取。
    (5). ref_or_null
    该联接类型如同ref,但是添加了MySQL可以专门搜索包含NULL值的行。在解决子查询中经常使用该联接类型的优化。
    (6). index_merge
    该联接类型表示使用了索引合并优化方法。在这种情况下,key列包含了使用的索引的清单,key_len包含了使用的索引的最长的关键元素。

    (7). unique_subquery
    该类型替换了下面形式的IN子查询的ref:

    value IN (SELECT primary_key FROM single_table WHERE some_expr)
    unique_subquery是一个索引查找函数,可以完全替换子查询,效率更高。

    (8).index_subquery

    该联接类型类似于unique_subquery。可以替换IN子查询,但只适合下列形式的子查询中的非唯一索引:

    value IN (SELECT key_column FROM single_table WHERE some_expr)

    (9).range

    只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引。key_len包含所使用索引的最长关键元素。在该类型中ref列为NULL。
    (10).index
    该联接类型与ALL相同,除了只有索引树被扫描。这通常比ALL快,因为索引文件通常比数据文件小。
    当查询只使用作为单索引一部分的列时,MySQL可以使用该联接类型。
    (11). ALL
    对于每个来自于先前的表的行组合,进行完整的表扫描。如果表是第一个没标记const的表,这通常不好,并且通常在它情况下很差。通常可以增加更多的索引而不要使用ALL,使得行能基于前面的表中的常数值或列值被检索出。
    5.possible_keys
    possible_keys列指出MySQL能使用哪个索引在该表中找到行。注意,该列完全独立于EXPLAIN输出所示的表的次序。这意味着在possible_keys中的某些键实际上不能按生成的表次序使用。

    如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查WHERE子句看是否它引用某些列或适合索引的列来提高你的查询性能。如果是这样,创造一个适当的索引并且再次用EXPLAIN检查查询

    6. key
    key列显示MySQL实际决定使用的键(索引)。如果没有选择索引,键是NULL。要想强制MySQL使用或忽视possible_keys列中的索引,在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。

    7.key_len
    key_len列显示MySQL决定使用的键长度。如果键是NULL,则长度为NULL。
    使用的索引的长度。在不损失精确性的情况下,长度越短越好

    8. ref
    ref列显示使用哪个列或常数与key一起从表中选择行。

    9. rows
    rows列显示MySQL认为它执行查询时必须检查的行数。

    10. Extra
    该列包含MySQL解决查询的详细信息,下面详细.

    (1).Distinct
    一旦MYSQL找到了与行相联合匹配的行,就不再搜索了

    (2).Not exists
    MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行,

    就不再搜索了

    (3).Range checked for each

    Record(index map:#)
    没有找到理想的索引,因此对于从前面表中来的每一个行组合,MYSQL检查使用哪个索引,并用它来从表中返回行。这是使用索引的最慢的连接之一

    (4).Using filesort
    看到这个的时候,查询就需要优化了。MYSQL需要进行额外的步骤来发现如何对返回的行排序。它根据连接类型以及存储排序键值和匹配条件的全部行的行指针来排序全部行

    (5).Using index
    列数据是从仅仅使用了索引中的信息而没有读取实际的行动的表返回的,这发生在对表的全部的请求列都是同一个索引的部分的时候

    (6).Using temporary
    看到这个的时候,查询需要优化了。这里,MYSQL需要创建一个临时表来存储结果,这通常发生在对不同的列集进行ORDER BY上,而不是GROUP BY上

    (7).Using where
    使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。如果不想返回表中的全部行,并且连接类型ALL或index,这就会发生,或者是查询有问题

    mysql的字符集和校验规则的概念

    2009年07月2日 下午 10:00 | 作者:pangyt

    【转】
    作者:淘宝DBA team blog
    URL:http://rdc.taobao.com/blog/dba/html/180_mysql_characterset_collation_concept.html
    刚刚接触mysql的人(like me),可能对这2个概念不是太理解,这里小小解释一下,希望能说明清楚这个问题。
    字符集,character set,就是一套表示字符的符号和这些的符号的底层编码;而校验规则,则是在字符集内用于比较字符的一套规则。字符集还是比较容易理解的,主要是校验规则,下面我简单举个例子来说明一下:
    如在某个字符集“X”的A与a,他们的底层编码分别是A=0,a=100。这里符号“A”“a”和底层编码“0”“100”就是字符集的概念范围。假设我们要比较A与a的大小,我们得到a>A,因为我们是根据其底层编码进行比较的,这就是这个字符集“X”的一种校验规则“Z”(根据底层编码来比较)。假设,现在有另外一种校验规则,是先取其相反数,然后再比较大小,那么就很显然的得到a

    关于字符集与校验规则,mysql能:

    1、使用字符集来存储字符串,支持多种字符集;
    2、使用校验规则来比较字符串,同种字符集还能使用多种校验规则来比较;
    3、在同一台服务器、同一个数据库或者甚至在同一个表中使用不同字符集或校对规则来混合组合字符串;
    4、可以在任何级别(服务器、数据库、表、字段、字符串),定义不同的字符集和校验规则。

    查询你的mysql数据库所支持的字符集种类,可以如下:
    mysql> show character set;
    +———-+—————————–+———————+——–+
    | Charset | Description | Default collation | Maxlen |
    +———-+—————————–+———————+——–+
    | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
    | dec8 | DEC West European | dec8_swedish_ci | 1 |
    | ………| …………………. | ……………. | . |
    | eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
    +———-+—————————–+———————+——–+
    36 rows in set (0.00 sec)

    这里的maxlen表示要用最大多少个字节来存储字符集的单个词,default collation表示该字符集的默认校验规则。
    你也可以利用like来进行筛选,如下:
    mysql> show character set like ‘latin%’;
    +———+—————————–+——————-+——–+
    | Charset | Description | Default collation | Maxlen |
    +———+—————————–+——————-+——–+
    | latin1 | cp1252 West European | latin1_swedish_ci | 1 |
    | latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
    | latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
    | latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
    +———+—————————–+——————-+——–+
    4 rows in set (0.00 sec)

    查询你的mysql数据库所支持字符集的校验规则,可以如下:
    mysql> show collation;
    +———————-+———-+—–+———+———-+———+
    | Collation | Charset | Id | Default | Compiled | Sortlen |
    +———————-+———-+—–+———+———-+———+
    | big5_chinese_ci | big5 | 1 | Yes | Yes | 1 |
    | big5_bin | big5 | 84 | | Yes | 1 |
    | dec8_swedish_ci | dec8 | 3 | Yes | | 0 |
    | …….. | …. | .. | … | … | . |
    | eucjpms_bin | eucjpms | 98 | | Yes | 1 |
    +———————-+———-+—–+———+———-+———+
    127 rows in set (0.00 sec)

    这里compiled表示该collation所对应的character set是否被编译到此mysql数据库,通过此点就可以知道该mysql数据库是否支持某个字符集。sortlen表示要在内存中排序时,该字符集的字符要占用多少个字节。
    你也可以利用like来进行筛选,如下:
    mysql> show collation like ‘latin1%’;
    +——————-+———+—-+———+———-+———+
    | Collation | Charset | Id | Default | Compiled | Sortlen |
    +——————-+———+—-+———+———-+———+
    | latin1_german1_ci | latin1 | 5 | | Yes | 1 |
    | latin1_swedish_ci | latin1 | 8 | Yes | Yes | 1 |
    | latin1_danish_ci | latin1 | 15 | | Yes | 1 |
    | latin1_german2_ci | latin1 | 31 | | Yes | 2 |
    | latin1_bin | latin1 | 47 | | Yes | 1 |
    | latin1_general_ci | latin1 | 48 | | Yes | 1 |
    | latin1_general_cs | latin1 | 49 | | Yes | 1 |
    | latin1_spanish_ci | latin1 | 94 | | Yes | 1 |
    +——————-+———+—-+———+———-+———+
    8 rows in set (0.00 sec)

    大家可能已经发现collation的名字似乎有规律可循,其实的确也是这样的,并且它也有些特征,如下:
    1、两个不同的字符集不能有相同的校验规则(字符集:校验规则 = 1:n);
    2、每个字符集都有一个校验规则,就是对应的DEFAULT=YES的那个collation;
    3、collation命名规则:字符集名_对应的语言名_ci/cs/bin,其中ci表示大小写不敏感性,cs表示大小写敏感性,bin表示二进制。