阳光网驿-企业信息化交流平台【DTC零售连锁全渠道解决方案】

 找回密码
 注册

QQ登录

只需一步,快速开始

扫描二维码登录本站

手机号码,快捷登录

老司机
查看: 2016|回复: 1

[转帖] 关于2G以上文本文件的MYSQL数据导入

[复制链接]

该用户从未签到

发表于 2009-4-11 10:20:55 | 显示全部楼层 |阅读模式
大容量的文件导入MYSQL方法(LINUX系统):
在使用MYSQLIMPORT导入大容量数据时,mysql一定会提示导入不成功,让你设置大的缓存,但是究竟设多大你也不好界定,所以我们可以从导入的原始文件入手,把他拆分为小的文件。
涉及到的工具:
1.使用MYSQL自带的导入工具MYSQLIMPORT
2.使用LINUX自带的拆分工具SPLIT
步骤:
1.使用SPLIT命令拆分源文件,拆分多大由你控制。
   命令格式:
             split -l 行数 源文件
             (通过行数来控制文件的大小)
这时系统会将文件拆分成小文件,每个文件的行数是你自己定义的。拆分的文件名有系统自动生成。
2.使用MYSQLIMPORT导入数据。
   mysqlimport的命令详解
.mysqlimport的常用选项介绍:
    选项             功能
-L                 导入本地文件
-d or --delete     新数据导入数据表中之前删除数据数据表中的所有信息
-f or --force     不管是否遇到错误,mysqlimport将强制继续插入数据
-i or --ignore     mysqlimport跳过或者忽略那些有相同唯一关键字的行, 导入文件中的数据将被忽略。
-l or -lock-tables 数据被插入之前锁住表,这样就防止了,你在更新数据库时,用户的查询和更新受到影响。
-r or -replace     这个选项与-i选项的作用相反;此选项将替代表中有相同唯一关键字的记录。
--fields-enclosed- by= char
          指定文本文件中数据的记录时以什么括起的, 很多情况下数据以双引号括起。 默认的情况下数据是没有被字符括起的。
--fields-terminated- by=char
          指定各个数据的值之间的分隔符,在句号分隔的文件中,分隔符是句号。您可以用此选项指定数据之间的分隔符。默认的分隔符是跳格符(Tab)
--lines-terminated- by=str
          此选项指定文本文件中行与行之间数据的分隔字符串或者字符。 默认的情况下mysqlimport以newline为行分隔符。
          您可以选择用一个字符串来替代一个单个的字符:一个新行或者一个回车。
mysqlimport命令常用的选项还有-v 显示版本(version), -p 提示输入密码(password)等。

3).例子:导入一个以逗号为分隔符的文件文件中行的记录格式是这样的:
1,werwer,345345,585858
命令:
./mysqlimport -u用户名 -p密码 -L -v --fields-terminated-by=, 库名 表名.txt
表名.TXT这里需要注意的是,要把split拆分的文件重命名为表名.txt(在LINUX下重命名可以用mv 源文件名 目的文件名),这样MYSQLIMPORT才能导入到你想导入的表中,比如库名是city,表名是sms,那么命令就应该为:./mysqlimport -u用户名 -p密码 -L -v --fields-terminated-by=, city sms.txt
经过我的测试,MYSQLIMPORT这个工具的导入速度是相当的快的2G的文件有10分钟就可以了(机器的配置是至强2.1,内存2G)

评分

参与人数 1阳光币 +1 收起 理由
sunwy + 1 这样的转帖还是有技术含量

查看全部评分

楼主热帖
启用邀请码注册,提高发帖质量,建设交流社区
  • TA的每日心情
    无聊
    2015-4-24 01:56
  • 签到天数: 1341 天

    [LV.10]以坛为家III

    发表于 2009-4-12 02:02:15 | 显示全部楼层
    学习了~~~~~~~~~~~~
    启用邀请码注册,提高发帖质量,建设交流社区
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    快速回复 返回顶部 返回列表