虎克的博客

Enthusiasm Biogeography-Biodiversity Informatics-Data Sciences

修改及查看mysql数据库的字符集

| Comments

Liunx下修改MySQL字符集:

1.查找MySQL的cnf文件的位置

find / -iname ‘*.cnf’ -print

/usr/share/mysql/my-innodb-heavy-4G.cnf
/usr/share/mysql/my-large.cnf
/usr/share/mysql/my-small.cnf
/usr/share/mysql/my-medium.cnf
/usr/share/mysql/my-huge.cnf
/usr/share/texmf/web2c/texmf.cnf
/usr/share/texmf/web2c/mktex.cnf
/usr/share/texmf/web2c/fmtutil.cnf
/usr/share/texmf/tex/xmltex/xmltexfmtutil.cnf
/usr/share/texmf/tex/jadetex/jadefmtutil.cnf
/usr/share/doc/MySQL-server-community-5.1.22/my-innodb-heavy-4G.cnf
/usr/share/doc/MySQL-server-community-5.1.22/my-large.cnf
/usr/share/doc/MySQL-server-community-5.1.22/my-small.cnf
/usr/share/doc/MySQL-server-community-5.1.22/my-medium.cnf
/usr/share/doc/MySQL-server-community-5.1.22/my-huge.cnf

2. 拷贝 small.cnf、my-medium.cnf、my-huge.cnf、my-innodb-heavy-4G.cnf其中的一个到/etc下,命名为my.cnf
cp /usr/share/mysql/my-medium.cnf /etc/my.cnf

3. 修改my.cnf

vi /etc/my.cnf

在[client]下添加
default-character-set=utf8

在[mysqld]下添加
default-character-set=utf8

4.重新启动MySQL
[root@bogon ~]# /etc/rc.d/init.d/mysql restart
Shutting down MySQL                                        [ 确定 ]
Starting MySQL.                                            [ 确定 ]
[root@bogon ~]# mysql -u root -p
Enter password:
Welcome to the MySQL monitor. Commands end with ; or \g.
Your MySQL connection id is 1
Server version: 5.1.22-rc-community-log MySQL Community Edition (GPL)

Type ‘help;’ or ‘\h’ for help. Type ‘\c’ to clear the buffer.

5.查看字符集设置

mysql> show variables like ‘collation_%’;
+———————-+—————–+
| Variable_name        | Value           |
+———————-+—————–+
| collation_connection | utf8_general_ci |
| collation_database   | utf8_general_ci |
| collation_server     | utf8_general_ci |
+———————-+—————–+
3 rows in set (0.02 sec)

mysql> show variables like ‘character_set_%’;
+————————–+—————————-+
| Variable_name            | Value                      |
+————————–+—————————-+
| character_set_client     | utf8                       |
| character_set_connection | utf8                       |
| character_set_database   | utf8                       |
| character_set_filesystem | binary                     |
| character_set_results    | utf8                       |
| character_set_server     | utf8                       |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+————————–+—————————-+
8 rows in set (0.02 sec)

mysql>

其他的一些设置方法:

修改数据库的字符集
   mysql>use mydb

   mysql>alter database mydb character set utf-8;
创建数据库指定数据库的字符集

   mysql>create database mydb character set utf-8;

通过配置文件修改:

修改/var/lib/mysql/mydb/db.opt
default-character-set=latin1
default-collation=latin1_swedish_ci

default-character-set=utf8
default-collation=utf8_general_ci

重起MySQL:
[root@bogon ~]# /etc/rc.d/init.d/mysql restart

通过MySQL命令行修改:

mysql> set character_set_client=utf8;
Query OK, 0 rows affected (0.00 sec)

mysql> set character_set_connection=utf8;
Query OK, 0 rows affected (0.00 sec)

mysql> set character_set_database=utf8;
Query OK, 0 rows affected (0.00 sec)

mysql> set character_set_results=utf8;
Query OK, 0 rows affected (0.00 sec)

mysql> set character_set_server=utf8;
Query OK, 0 rows affected (0.00 sec)

mysql> set character_set_system=utf8;
Query OK, 0 rows affected (0.01 sec)

mysql> set collation_connection=utf8;
Query OK, 0 rows affected (0.01 sec)

mysql> set collation_database=utf8;
Query OK, 0 rows affected (0.01 sec)

mysql> set collation_server=utf8;
Query OK, 0 rows affected (0.01 sec)

查看:
mysql> show variables like ‘character_set_%’;
+————————–+—————————-+
| Variable_name            | Value                      |
+————————–+—————————-+
| character_set_client     | utf8                       |
| character_set_connection | utf8                       |
| character_set_database   | utf8                       |
| character_set_filesystem | binary                     |
| character_set_results    | utf8                       |
| character_set_server     | utf8                       |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+————————–+—————————-+
8 rows in set (0.03 sec)

mysql> show variables like ‘collation_%’;
+———————-+—————–+
| Variable_name        | Value           |
+———————-+—————–+
| collation_connection | utf8_general_ci |
| collation_database   | utf8_general_ci |
| collation_server     | utf8_general_ci |
+———————-+—————–+
3 rows in set (0.04 sec)

————————————————————————-

【知识性文章转载】

MYSQL 字符集问题

MySQL的字符集支持(Character Set Support)有两个方面:

     字符集(Character set)和排序方式(Collation)。

对于字符集的支持细化到四个层次:

     服务器(server),数据库(database),数据表(table)和连接(connection)。

1.MySQL默认字符集

MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。

但是,传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢?    (1)编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;

    (2)安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;

    (3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;

    (4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server;

    (5)当选定了一个数据库时,character_set_database 被设定为这个数据库默认的字符集;

    (6)在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;

    (7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

简单的总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

2.查看默认字符集(默认情况下,mysql的字符集是latin1(ISO_8859_1)

通常,查看系统的字符集和排序方式的设定可以通过下面的两条命令:

     mysql> SHOW VARIABLES LIKE ‘character%’;

+————————–+———————————+

| Variable_name            | Value                           |

+————————–+———————————+

| character_set_client     | latin1                          |

| character_set_connection | latin1                          |

| character_set_database   | latin1                          |

| character_set_filesystem | binary                    |

| character_set_results    | latin1                          |

| character_set_server     | latin1                          |

| character_set_system    | utf8                            |

| character_sets_dir       | D:"mysql-5.0.37"share"charsets" |

+————————–+———————————+

mysql> SHOW VARIABLES LIKE ‘collation_%’;

+———————-+—————–+

| Variable_name        | Value           |

+———————-+—————–+

| collation_connection | utf8_general_ci |

| collation_database   | utf8_general_ci |

| collation_server     | utf8_general_ci |

+———————-+—————–+

3.修改默认字符集

(1) 最简单的修改方法,就是修改mysql的my.ini文件中的字符集键值,

如    default-character-set = utf8

      character_set_server = utf8

   修改完后,重启mysql的服务,service mysql restart

   使用 mysql> SHOW VARIABLES LIKE ‘character%’;查看,发现数据库编码均已改成utf8

+————————–+———————————+

| Variable_name            | Value                           |

+————————–+———————————+

| character_set_client     | utf8                            |

| character_set_connection | utf8                            |

| character_set_database   | utf8                            |

| character_set_filesystem | binary                          |

| character_set_results    | utf8                            |

| character_set_server     | utf8                            |

| character_set_system     | utf8                            |

| character_sets_dir       | D:"mysql-5.0.37"share"charsets" |

+————————–+———————————+

   (2) 还有一种修改字符集的方法,就是使用mysql的命令

   mysql> SET character_set_client = utf8 ;

 

原文地址:http://blog.chinaunix.net/u1/51541/showart_505638.html

如何在ASP.NET MVC视图中使用DataTable对象

| Comments

控制器代码

public ActionResult Index()
{    
  DataTable dt = new DataTable(); 
    return View(dt);

}

视图代码

Inherits="System.Web.Mvc.ViewPage<System.Data.DataTable>"
显示数据
<% foreach (System.Data.DataRow row in Model.Rows)
           { %>
            <%= row["columnName"].ToString() %>
        <%}%>

使用JavaScript脚本控制查询页面导航和清除用户输入字符串的首尾空格

| Comments

对于查询页面来说,经常会在页面上设置查询信息类别的选项,希望根据用户的查询的信息类别导航的不同的结果页面。并且能够去掉用户输入文本的首尾空格(这个在用户从其它地方拷贝查询字符串过来的时候是经常发生的事情)。以下面的为例子:

image

JavaScript脚本

function doSearch() {        
        var category = document.getElementsByName("category");
        var queryinput = document.getElementById('SearchName').value;
        var query = queryinput.replace(/^\s+|\s+$/g, "");        
        document.getElementById('SearchName').value =query;
        document.getElementById('SearchName').disabled = true;
        for (var i = 0; i < category.length; i++) {
            if (category[0].checked) {
                window.location = "/name/search?category=name&q=" + query + "&page=" + 1;
            }
            if (category[1].checked) {
                window.location = "/vernacular/search?category=vernacular&q=" + query + "&page=" + 1;
            }
        }
    }

处理用户输入文本空格的方法和原理可以参考这篇文章

3D标签云示例

| Comments

示例

[video src=”Video_2010-12-14_014231.wmv”]

页面脚本引用代码:

swfobject.addDomLoadEvent(function () {
		swfobject.embedSWF(
					"../../text_and_image_cloud.swf", "myContent1",
					"180", "220",
					"10", "../../expressInstall.swf",
					{
						cloud_data: "../../cloud_data.xml",
						tcolor: "0x999999",
						tcolor2: "0x666666",
						hicolor: "0x494949",
						tspeed: "250",
						fontFace: "Arial"
					},
					{ wmode: "window", menu: "false", quality: "best" }
					);
	});

XML标签数据格式:

 


	生物多样性



	物种编目



	生物多样性信息学



	标准



	数据库



	协议



	文献



	动态
	


	新闻



	IUCN



	保护



	形态



	鉴定



	新种



	Web


相关资源可以从这里下载

 

Sql如何从单个具有重复项的表中获得统计数据

| Comments

我们经常遇到需要从一张多个字段具有不唯一重复值的表中统计数据的情况,表结构如下图:

Lisong_2010-11-08_144758

表中只有一个字符型字段CanonicalString和ID具有唯一值,其它字段都有不同程度的重复。需要的结果是统计每一个不同分类等级(界、门、纲、目、科、属)的下级分类单元有多少。例如:统计出每一个科(TaxonFamily)有多少个属(TaxonGenus),多少个分类群(CanonicalString);统计每一个门有多纲、目、科、属等等,其它依次类推。

1、统计每一个科有多少分类群

 

SELECT  TaxonFamily AS Family ,

        COUNT(Id) AS TaxonNumber

FROM    dbo.Taxons

GROUP BY TaxonFamily

ORDER BY TaxonNumber DESC
运行结果:
image 

2、统计类群数目最多的10个科

 

SELECT TOP(10)  TaxonFamily AS Family ,



        COUNT(Id) AS TaxonNumber



FROM    dbo.Taxons



GROUP BY TaxonFamily



ORDER BY TaxonNumber DESC

 

3、统计每一个科包括有多少个属

 

SELECT  TaxonFamily AS Family ,

        COUNT(DISTINCT ( TaxonGenus )) AS GenusNumber

FROM    dbo.Taxons

GROUP BY TaxonFamily

ORDER BY GenusNumber DESC

 

运行结果:

image

4、统计每一个科的属和分类群的数目

 
SELECT  TaxonFamily AS Family ,
        COUNT(DISTINCT ( TaxonGenus )) AS GenusNumber ,
        COUNT(Id) AS TaxonNumber
FROM    dbo.Taxons
GROUP BY TaxonFamily
ORDER BY GenusNumber DESC

运行结果:

image

5、统计每一个属包括的分类群数目并显示这个属的科名

SELECT TaxonFamily AS Family,  TaxonGenus AS Genus ,
        COUNT(Id) AS TaxonNumber
FROM    dbo.Taxons
GROUP BY TaxonGenus, TaxonFamily
ORDER BY TaxonNumber DESC

运行结果:

image

6、统计某一个科的属和分类群数目

SELECT  TaxonFamily AS Family ,
        COUNT(DISTINCT ( TaxonGenus )) AS GenusNumber ,
        COUNT(Id) AS TaxonNumber
FROM    dbo.Taxons
WHERE   TaxonFamily = 'Pinaceae'
GROUP BY TaxonFamily

运行结果:

image

7、统计物种名字字段(CanonicalString)中空格出现的次数

SELECT  Id ,
        CanonicalString ,
        LEN(CanonicalString) - LEN(REPLACE(CanonicalString, ' ', '')) AS 空格出现次数
FROM    dbo.Taxons

运行结果如下:

image

上面这个语句的作用是当我们没有有效标记改类群的分类等级,种或者亚种、变种的时候,可以用来作为筛选记录的一个备选方法。

8、统计每一个科有多少属和种(不包括种下等级的情况)

SELECT  TaxonFamily AS Family ,
        COUNT(DISTINCT ( TaxonGenus )) AS GenusNumber ,
        COUNT(Id) AS SpeciesNumber
FROM    dbo.Taxons
WHERE   LEN(CanonicalString) - LEN(REPLACE(CanonicalString, ' ', '')) = 1
GROUP BY TaxonFamily

9、统计每一个大类群(蕨类、苔藓、双子叶等)有的科、属、种的数目

2010-12-12_210829

--统计大类群的科、属、类群数目
SELECT  TaxonGroup ,
        COUNT(DISTINCT ( TaxonFamily )) AS FamilyNumber ,
        COUNT(DISTINCT ( TaxonGenus )) AS GenusNumber ,
        COUNT(Id) AS TaxonNumber
FROM    dbo.Taxons
GROUP BY TaxonGroup
ORDER BY FamilyNumber DESC

--统计大类群的科、属、类群数目
SELECT  TaxonGroup ,
        COUNT(DISTINCT ( TaxonFamily )) AS FamilyNumber ,
        COUNT(DISTINCT ( TaxonGenus )) AS GenusNumber ,
        COUNT(Id) AS SpeciesNumber
FROM    dbo.Taxons
WHERE   [RANK] = 'species'
GROUP BY TaxonGroup
ORDER BY FamilyNumber DESC

中国有多少高等植物?

| Comments

image

上面这个图是澳大利亚国家环境保护部发布的信息,从上面这个图看中国特有的维管植物连12000种都不到,实在匪夷所思。无论从哪个文献和著作中也没有发现有这样的数据报道。我在这里给他更新一下。中国高等植物的种数目已经是3万9千余种,特有的是1万6千多种,占几乎一半。澳大利亚的科学家该打屁股了!

中国高等植物信息系统新版上线测试

| Comments

中国高等植物信息系统经过一段时间的开发和调试,现在开发部分功能上线进行测试。欢迎你试用并提出意见。

2010-12-02_022308

分类树:AJAX Json异步加载,约4万个节点

image

动态图表:OpenFlashChart, MSChart

image

image

 

全文检索:Lucene.NET

目前只提供有关物种描述文本信息的全文检索,稍后将实现全站索引检索

image

新闻-事件-地图

image

物种详细信息-用户评论/评分-图片浏览

2010-12-02_143350_副本

使用Host-tracker来监测网站

| Comments

2010-11-26_205151

网站管理员可以利用http://host-tracker.com/来监测网站是否允许良好和挂机的情况,如果网站挂机还可以通过电子邮件通知。使用方法非常简单。只需要到host-tracker网站输入自己的网址,然后点击Check now,系统会发生异地请求的想要报告。在Subscribe框填入邮件地址就可以收到网站情况的消息。大笑

如何在Windows操作系统下下载github上的开源代码

| Comments

现在越来越多的开源项目都通过github来进行管理,习惯了使用SVN的朋友可能不熟悉github下载代码方法。比较简单。

1、下载Git for windows然后安装,主要安装过程的一些选项;

2、进入你希望保存源代码的文件夹,然后在文件夹上点右键弹出git菜单如下图,选择git bash here

2010-09-16_162309

3、在弹出的unix shell窗口输入需要下载代码的http地址(红色部分),如下图

2010-09-16_161757