數(shù)據(jù)導出不只是bcp這一種方式,不過bcp的最大優(yōu)點是可以根據(jù)id批量導出數(shù)據(jù),這樣是節(jié)省時間的。還有一種是直接在頁面導出數(shù)據(jù),頁面列出數(shù)據(jù)庫中的數(shù)據(jù),然后選擇一種方式(如xls)導出來。
由于日;径际桥c數(shù)據(jù)庫打交道,我會經(jīng)常遇到數(shù)據(jù)轉移的需求。類似于:將服務器A的表數(shù)據(jù)轉移到服務器B的同名表中,或?qū)⒕上服務器的一部分數(shù)據(jù)拉到線下測試服務器供開發(fā)人員調(diào)試。通常來說,有以下幾種表到表的復制方法:
1.建鏈接服務器,寫INSERT語句。 適用于兩臺服務器能互相連接,在表的數(shù)量比較少的情況下,手動寫INSERT語句還是可以接受的。但如果兩臺服務器無法互聯(lián)或連接速度較慢,或者多個表需要手寫插入列名,寫起來會很麻煩,還要調(diào)試語句。
2.查詢出所有數(shù)據(jù)或需要導出的數(shù)據(jù)或用導出工具存成EXCEL,再用導入工具導入目標表。對于數(shù)據(jù)量不大、比較標準、可以規(guī)則的存成EXCEL的數(shù)據(jù)可以使用這種方法,反之會有各種問題,最常見的就是大文本在導出成EXCEL后經(jīng)常會無法原樣導入,報各種格式錯。
3.查出需要導出的數(shù)據(jù),復制一下,在SSMS的編輯兩200行中選中行復制。這種方法和第二種問題類似,更快一點,但要求也更嚴。要求更小的數(shù)據(jù)量,更規(guī)則的數(shù)據(jù)。
4.原庫做備份--目標服務器還原備份--跨庫插入數(shù)據(jù)或者直接用還原的庫。這種能完全COPY多個表,但缺點一是麻煩,二是需要登陸到服務器上復制備份文件下來,這在管理嚴密的公司里很可能是要領導簽字的。大家懂的,所以我也不常用這種方法。
5.BCP實用工具,也就是本文要介紹的,我現(xiàn)在最常用的數(shù)據(jù)遷移工具。無視大文本的不規(guī)則字符,無視大數(shù)據(jù)量,通過中間文件傳輸,不必登陸服務器本機。下面就從最簡單的例子入手,介紹一下BCP的用法。
假設源表名T1,數(shù)據(jù)庫名DB1,服務器器實例為SERVER1,目標表名T2,數(shù)據(jù)庫名DB2,服務器實例為SERVER2。T1和T2的結構完全一樣。T2中主鍵與T1不重復或者直接是空表。
首先是導出語句:
BCP DB1.DBO.T1 out d:\T1.dat -S SERVER1 -U sa -P sa -n
在一臺能連接SERVER1的裝有SQLSERVER的機器上(比如SERVER1本機)的命令行CMD中運行這句命令,就會開始運行導出程序,完成后,會在D盤生成一個名為T1.dat的文件。把這個文件COPY到一臺能連接SERVER2,裝有SQLSERVER的機器上,運行下面的導入語句:
BCP DB2.DBO.T2 in d:\t1.dat -S SERVER2 -U sa -P sa -n
這樣就可以了。
下面就對上面兩個語句做一下說明。
BCP是命令,不解釋。
DB1.DBO.T1是指定庫名、架構名和表名。
out/in是確定方向,out是表導出,in是表導入。out可以改成queryout,對應的前面要改成查詢語句,也就是從DB1.DBO.T1改成"SELECT * FROM DB1.DBO.T1 WHERE ...."這樣的,實現(xiàn)指定數(shù)據(jù)導出。
d:\T1.dat是指定文件路徑。文件名和后綴名都是隨便寫的,我只是習慣用這種寫法,因為我會經(jīng)常做多個表的BCP導出,命名規(guī)律一點方便通過表名拼BCP語句。
-S -U -P 分別是指定實例名、用戶名和密碼,權限的話out需要select權限,in需要SELECT和INSERT權限,如果指定了幾個特殊選項,比如標識列原樣插入,還需要ALTER TABLE權限。
-n是指定格式,這里是指定了使用本機格式(-n),數(shù)據(jù)會以16進制的形式存儲于文件中,因此不存在大文本干擾格式的問題,只要兩個表的結構完全一樣,一定會成功的。
還有一些其它的格式,如-c,是為了給不同類型的數(shù)據(jù)庫(如MYSQL或ORACLE)導入用的,它會導出成標準的文本格式,但這就會導致一些含亂碼和不規(guī)則字符的大文本干擾導入,所以我在不關注數(shù)據(jù)文件內(nèi)容的時候都是用-n的格式的。
此外還有一些擴展參數(shù),如添加-E后開啟標識列原樣插入,用于原樣復制含有IDENTITY列的表。-b指定批大小,-F和-L指定起始和終止行數(shù)。想了解的可以去MSDN的說明上自己了解,我就不多復制了,只提供原文地址:
http://msdn.microsoft.com/zh-cn/library/ms162802.aspx
注意除了BCP和IN/OUT,后面的所有參數(shù)都是大小寫敏感,-S不要寫成-s,-n和-N的含義也不同。
---------------------------------------用分割線,就是這么自信---------------------------------------------------
下面說一下另一種擴展。很多時候,需要導出的表有多個甚至是全庫,這時我一般會先用系統(tǒng)表查出表名,或在EXCEL中寫入需要的全部表名,然后復制一下,再在CMD中粘貼,就可以實現(xiàn)多表的導入導出了。下面就貼出一段庫中全表BCP導出的生成SQL,供大家參考:
SELECT 'BCP DB1.DBO.'+NAME+' OUT D:\'+NAME+'.dat -S SERVER1 -U sa -P sa -n'
,'TRUNCATE TABLE '+NAME
,'BCP DB2.DBO.'+NAME+' in D:\'+NAME+'.dat -S SERVER2 -U sa -P sa -n'
FROM SYS.TABLES
ORDER BY NAME
第一句復制到cmd中導出所有文件,復制文件到能庫目標庫的機器上,先用TRUNCATE在SSMS中運行清空SERVER2上的所有待導入表,再運行第二個BCP語句導入。我一直是這樣做的,在結構一致的情況下,至今沒出過問題。
另外一種方法:使用SSMS的生成腳本功能,在選項中選擇生成數(shù)據(jù)腳本(2008和R2不一樣,一個是有個是和否,另一個是三個選項:生成、生成和數(shù)據(jù)、數(shù)據(jù)),能生成表中所有INSERT的語句,也可以原樣復制,對于超大的數(shù)據(jù)量,生成的腳本也是超超大的,一般來說小于1W行的數(shù)據(jù)可以使用。