正文

gpt2訓(xùn)練寫材料（gpt2訓(xùn)練寫小說）

發(fā)布時(shí)間：2023-03-19 06:36:59 稿源：創(chuàng)意嶺閱讀： 138 問大家

大家好！今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于gpt2訓(xùn)練寫材料的問題，以下是小編對(duì)此問題的歸納整理，讓我們一起來看看吧。

開始之前先推薦一個(gè)非常厲害的Ai人工智能工具，一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等

只需要輸入關(guān)鍵詞，就能返回你想要的內(nèi)容，越精準(zhǔn)，寫出的就越詳細(xì)，有微信小程序端、在線網(wǎng)頁版、PC客戶端

官網(wǎng)：https://ai.de1919.com

本文目錄:

1、GPT的auto-regressive語言模型架構(gòu)在信息表示方面有什么架構(gòu)上的缺陷？具體如何改進(jìn)？
2、playground怎么找到gpt
3、《預(yù)訓(xùn)練周刊》第33期：預(yù)訓(xùn)練語言模型的高效分層域適應(yīng)
4、關(guān)于UEFI啟動(dòng)+GPT分區(qū) 的一些經(jīng)驗(yàn)

gpt2訓(xùn)練寫材料（gpt2訓(xùn)練寫小說）

一、GPT的auto-regressive語言模型架構(gòu)在信息表示方面有什么架構(gòu)上的缺陷？具體如何改進(jìn)？

1） GPT

在Bert 之后，OpenAI 的 GPT-2 就是其中之一。它在文本生成上有著驚艷的表現(xiàn)，其生成的文本在上下文連貫性和情感表達(dá)上都超過了人們對(duì)目前階段語言模型的預(yù)期。僅從模型架構(gòu)而言，GPT-2 并沒有特別新穎的架構(gòu)，它和 transformer 的 Decoder 類似。相比較于GPT-1，GPT -2 使用了更大的預(yù)料，更大和更深的模型。

從transformer的decoder里移除了decoder對(duì)encoder的attention部分。也就是消除掉了seq2seq的過程。

GPT是一個(gè)語言模型，每一個(gè)時(shí)刻只能看見當(dāng)前時(shí)刻前面時(shí)刻的信息，是一個(gè)auto regressive的過程。

GPT2，hidden state的大小有變化，根據(jù)層數(shù)的多少有small，medum，large，extra large的劃分。

GPT的訓(xùn)練過程是交叉式的預(yù)測(cè)下一個(gè)單詞，測(cè)試的時(shí)候是輸入一個(gè)句子生成另外一個(gè)句子。

GPT的預(yù)訓(xùn)練就是訓(xùn)練一個(gè)語言模型。而bert的預(yù)訓(xùn)練是masked language model和nsp的任務(wù)。

GPT由多個(gè)decocer block組成，每一個(gè)decoder block由masked self-attention和feed forward neural network組成。

一個(gè)timestamp的hidden state經(jīng)過線性層轉(zhuǎn)換為vocab size大小的embedding，然后經(jīng)過softmax，算出每個(gè)詞匯的概率，找出其中概率最大的詞作為預(yù)測(cè)輸出，然后下一個(gè)時(shí)刻的詞作為真實(shí)輸出，計(jì)算兩者的cross entropy來訓(xùn)練模型。

每一個(gè)timestamp后面的位置都mask掉，設(shè)置一個(gè)負(fù)無群大的值，做softmax的時(shí)候，該位置的值就為0。

2）總結(jié)

transformer decoder的構(gòu)造
預(yù)訓(xùn)練的時(shí)候做語言模型的訓(xùn)練
GPT2用更多更深的block
BERT是做NLU，generation做不了
GPT天生就是語言模型，非常適合做generation的任務(wù)，在bert里能做的在gpt里也可以做

除了GPT-2 ，GPT-3依舊延續(xù)自己的單向語言模型訓(xùn)練方式，只不過把模型尺寸增大到了1750億，并且使用45TB數(shù)據(jù)進(jìn)行訓(xùn)練

二、playground怎么找到gpt

如果您想在Playground中使用GPT模型，可以按照以下步驟進(jìn)行：

1. 打開Google Colab（https://colab.research.google.com/）或者Jupyter Notebook等Python編程環(huán)境。

2. 導(dǎo)入相關(guān)的Python庫和GPT模型。例如，可以使用Hugging Face提供的transformers庫來加載預(yù)訓(xùn)練好的GPT-2模型：

```python

!pip install transformers

from transformers import GPT2Tokenizer, GPT2LMHeadModel

tokenizer = GPT2Tokenizer.from_pretrained('gpt2')

model = GPT2LMHeadModel.from_pretrained('gpt2', pad_token_id=tokenizer.eos_token_id)

```

3. 輸入文本并生成結(jié)果。通過調(diào)用model.generate()方法即可對(duì)輸入文本進(jìn)行自動(dòng)補(bǔ)全、摘要生成等任務(wù)，并輸出相應(yīng)的結(jié)果。

```python

input_text = "Hello, my name is John and I"

input_ids = tokenizer.encode(input_text, return_tensors='pt')

output_ids = model.generate(

input_ids,

max_length=50,

temperature=0.7,

num_beams=5,

no_repeat_ngram_size=4,

)

output_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)

print(output_text)

```

需要注意的是，在使用GPT模型時(shí)，需要確保計(jì)算資源充足，并且遵守相關(guān)法律法規(guī)和道德準(zhǔn)則，不得用于非法活動(dòng)或侵犯他人權(quán)益。

三、《預(yù)訓(xùn)練周刊》第33期：預(yù)訓(xùn)練語言模型的高效分層域適應(yīng)

關(guān)于周刊

本期周刊，我們選擇了9篇預(yù)訓(xùn)練相關(guān)的論文，涉及詞匯遷移、常識(shí)問答、多模態(tài)訓(xùn)練、層次訓(xùn)練、對(duì)比學(xué)習(xí)、圖像分割、圖文模型、蛋白質(zhì)作用和免疫特征表示的探索。此外，在研究動(dòng)態(tài)方面，我們選擇了2篇預(yù)訓(xùn)練資訊，將介紹大模型競(jìng)爭(zhēng)和視覺算法年度回顧方面的一些最新內(nèi)容。最后，在資源推薦方面，我們選擇了1篇預(yù)訓(xùn)練資源，將介紹跨語言摘要方面的一些最新內(nèi)容。

本期貢獻(xiàn)者：申德周翟珂吳新剛

論文推薦

標(biāo)題：俄羅斯Yandex、Facebook等 | Fine-Tuning Transformers: Vocabulary Transfer（微調(diào)Transformer：詞匯遷移）

簡(jiǎn)介：本文討論了巨大型預(yù)訓(xùn)練模型為下游任務(wù)微調(diào)而引發(fā)遷移學(xué)習(xí)的探索之一：詞匯遷移。自然語言處理領(lǐng)域最新進(jìn)展中Transformer已成為絕對(duì)主流。這些模型的大多數(shù)實(shí)際自然語言處理應(yīng)用通常是通過遷移學(xué)習(xí)實(shí)現(xiàn)的。本文研究了用于微調(diào)的語料庫特定標(biāo)記化是否會(huì)提高模型的最終性能。作者通過一系列的詞匯表優(yōu)化和遷移實(shí)驗(yàn)，證明了這種詞匯表優(yōu)化和遷移策略可以提高模型的性能。作者稱之為：在遷移學(xué)習(xí)領(lǐng)域開創(chuàng)了詞匯遷移的這一方向。

論文地址：「鏈接」

標(biāo)題：加州大學(xué) | Zero-shot Commonsense Question Answering with Cloze Translation and Consistency Optimization（基于完形轉(zhuǎn)換和一致性優(yōu)化的小樣本常識(shí)問答）

簡(jiǎn)介：本文在常識(shí)問答（CQA）方向研究預(yù)訓(xùn)練語言模型中的知識(shí)提取。作者將重點(diǎn)放在更好地利用預(yù)訓(xùn)練語言模型中存儲(chǔ)的知識(shí)。雖然研究人員發(fā)現(xiàn)，通過讓預(yù)先訓(xùn)練的語言模型填充精心設(shè)計(jì)的關(guān)系提取和文本分類提示的空白，可以提取嵌入在預(yù)訓(xùn)練的語言模型中的知識(shí)，但目前尚不清楚作者是否可以在CQA中采用這種范式，其中輸入和輸出的形式更加靈活。為此，作者研究了四種可以將自然問題翻譯成完形填空式句子的翻譯方法，以更好地從語言模型中獲取常識(shí)性知識(shí)，包括基于句法的模型、無監(jiān)督神經(jīng)模型和兩種監(jiān)督神經(jīng)模型。此外，為結(jié)合不同的翻譯方法，作者提議鼓勵(lì)使用未標(biāo)記數(shù)據(jù)對(duì)不同翻譯問題進(jìn)行模型一致性的預(yù)測(cè)。實(shí)驗(yàn)證明了作者的方法在三個(gè)CQA數(shù)據(jù)集上的有效性。

論文地址：「鏈接」

標(biāo)題：威斯康星大學(xué)、微軟等 | RegionCLIP: Region-based Language-Image Pretraining（基于區(qū)域的語言圖像預(yù)訓(xùn)練）

簡(jiǎn)介：本文研究了基于識(shí)別圖像區(qū)域的語言圖像預(yù)訓(xùn)練模型。業(yè)界使用“圖像-文本對(duì)”的對(duì)比語言圖像預(yù)訓(xùn)練 (CLIP)在零樣本和遷移學(xué)習(xí)中的圖像分類方面取得了令人印象深刻的結(jié)果。然而，作者表明直接應(yīng)用此類模型來識(shí)別圖像區(qū)域以進(jìn)行對(duì)象檢測(cè)會(huì)導(dǎo)致性能不佳，因?yàn)榇嬖谟蚱疲篊LIP 被訓(xùn)練以將圖像作為一個(gè)整體與文本描述進(jìn)行匹配，而沒有捕獲圖像之間的細(xì)粒度對(duì)齊區(qū)域和文本跨度。為了緩解這個(gè)問題，作者提出了一種稱為 RegionCLIP 的新方法，該方法顯著擴(kuò)展了 CLIP 以學(xué)習(xí)區(qū)域級(jí)視覺表示，從而實(shí)現(xiàn)圖像區(qū)域和文本概念之間的細(xì)粒度對(duì)齊。作者的方法利用 CLIP 模型將圖像區(qū)域與模板標(biāo)題匹配，然后預(yù)訓(xùn)練作者的模型以在特征空間中對(duì)齊這些區(qū)域-文本對(duì)。當(dāng)將作者的預(yù)訓(xùn)練模型轉(zhuǎn)移到開放詞匯對(duì)象檢測(cè)任務(wù)時(shí)，作者的方法在 COCO 和 LVIS 數(shù)據(jù)集上的新類別分別顯著優(yōu)于現(xiàn)有技術(shù) 3.8 AP50 和 2.2 AP。

論文地址：「鏈接」

代碼地址：https://github.com/microsoft/RegionCLIP

標(biāo)題：艾倫AI研究所、慕尼黑大學(xué) | Efficient Hierarchical Domain Adaptation for Pretrained Language Models（預(yù)訓(xùn)練語言模型的高效分層域適應(yīng)）

簡(jiǎn)介：本文研究了以分層樹結(jié)構(gòu)的域表示實(shí)現(xiàn)預(yù)訓(xùn)練語言模型的分層。生成式的語言模型，在不同的通用領(lǐng)域語料庫上進(jìn)行訓(xùn)練，然而這就限制了它們對(duì)更窄領(lǐng)域的適用性，之前的工作表明，持續(xù)的領(lǐng)域內(nèi)訓(xùn)練可以提供進(jìn)一步的收益。在本文中，作者介紹了一種使用計(jì)算效率高的適配器方法將域適應(yīng)擴(kuò)展到許多不同域的方法。作者的方法基于對(duì)文本域部分重疊的觀察，作者將域表示為分層樹結(jié)構(gòu)，其中樹中的每個(gè)節(jié)點(diǎn)都與一組適配器權(quán)重相關(guān)聯(lián)。當(dāng)與凍結(jié)的預(yù)訓(xùn)練語言模型相結(jié)合時(shí)，這種方法可以實(shí)現(xiàn)相關(guān)領(lǐng)域之間的參數(shù)共享，同時(shí)避免不相關(guān)領(lǐng)域之間的負(fù)面干擾。該方法很高效：對(duì)于 D 個(gè)域，計(jì)算成本為 O(log(D))。GPT-2 的實(shí)驗(yàn)結(jié)果和 C4 中 100 個(gè)最具代表性的網(wǎng)站中的大部分顯示了域內(nèi)的全面改進(jìn)。作者還為保留域提供了一種推理時(shí)間算法，并表明對(duì)通過樹的多條路徑進(jìn)行平均可以進(jìn)一步提高泛化效果，同時(shí)僅增加推理的邊際成本。

論文地址：「鏈接」

標(biāo)題：谷歌、亞馬遜等 | Supervised Graph Contrastive Pretraining for Text Classification（用于文本分類的有監(jiān)督圖對(duì)比預(yù)訓(xùn)練）

簡(jiǎn)介：本文介紹了用于文本分類的對(duì)比預(yù)訓(xùn)練技術(shù)。但是，通常可以使用來自與當(dāng)前任務(wù)共享標(biāo)簽語義的相關(guān)任務(wù)的標(biāo)記數(shù)據(jù)。作者假設(shè)有效地使用這些標(biāo)記數(shù)據(jù)可以更好地概括當(dāng)前任務(wù)。在本文中，作者提出了一種通過基于圖的監(jiān)督對(duì)比學(xué)習(xí)方法有效利用來自相關(guān)任務(wù)的標(biāo)記數(shù)據(jù)的新方法。作者通過將監(jiān)督信息從示例外推到令牌來制定令牌圖。作者的公式產(chǎn)生了一個(gè)嵌入空間，其中屬于同一類的高/低概率標(biāo)記彼此靠近/遠(yuǎn)離。作者還提出了詳細(xì)的理論見解、以作為本研究方法的驅(qū)動(dòng)。基于作者采用的數(shù)據(jù)集，實(shí)驗(yàn)表明：作者的方法優(yōu)于預(yù)訓(xùn)練方案 2.5 % 、并且基于示例級(jí)對(duì)比學(xué)習(xí)的公式提升約 1.8 %。此外，在零樣本場(chǎng)景中實(shí)驗(yàn)表明跨域有效性平均提升3.91%。最后，作者還證明了該方法可以用作知識(shí)蒸餾設(shè)置中的噪聲教師模型、約平均提升4.57% 。

論文地址：「鏈接」

標(biāo)題：百度 | ERNIE-ViLG: Unified Generative Pre-training for Bidirectional Vision-Language Generation（ERNIE-ViLG：雙向視覺語言生成的統(tǒng)一生成式預(yù)訓(xùn)練）

簡(jiǎn)介：視覺語言預(yù)訓(xùn)練模型極大地提高了圖像-文本生成任務(wù)的性能，但用于文本-圖像生成任務(wù)的大規(guī)模預(yù)訓(xùn)練模型仍在研究中。本文提出了ERNIE-ViLG，一個(gè)統(tǒng)一的生成式預(yù)訓(xùn)練框架，基于Transformer模型并將圖像生成和文本生成都表述為以文本/圖像輸入為條件的自回歸生成任務(wù)。雙向的圖像-文本生成模型簡(jiǎn)化了跨視覺和語言的語義對(duì)接。對(duì)于文本到圖像的生成過程，作者進(jìn)一步提出了一種端到端的訓(xùn)練方法來共同學(xué)習(xí)視覺序列生成器和圖像重建器。為了探索雙向文本-圖像生成的大規(guī)模預(yù)訓(xùn)練的前景，本文在1.45億圖像-中文文本對(duì)的大規(guī)模數(shù)據(jù)集上訓(xùn)練了一個(gè)100億參數(shù)的模型，該模型在文本-圖像和圖像-文本任務(wù)上都取得了最先進(jìn)的性能。

論文地址：「鏈接」

標(biāo)題：華中科大、西安交大、微軟 | A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained Vision-language Model（用預(yù)訓(xùn)練視覺語言模型進(jìn)行零樣本語義分割的基線）

簡(jiǎn)介：通過視覺語言預(yù)訓(xùn)練的零樣本圖像分類已經(jīng)漸趨成熟，然而在更廣泛的視覺問題上如物體檢測(cè)和語義分割還需研究。本文在預(yù)訓(xùn)練的視覺語言模型CLIP上構(gòu)建零樣本語義分割基線。該問題難點(diǎn)在于語義分割和CLIP模型在不同的視覺顆粒度上執(zhí)行，語義分割在像素上處理，而CLIP在圖像上執(zhí)行。為了彌補(bǔ)處理粒度上的差異，本文沒有使用普遍的基于FCN的單階段框架，而使用一個(gè)兩階段的語義分割框架，第一階段提取泛化掩碼，第二階段利用基于圖像的CLIP模型，對(duì)第一階段產(chǎn)生的掩碼圖像作物進(jìn)行零樣本分類。本文的實(shí)驗(yàn)結(jié)果表明，這個(gè)簡(jiǎn)單的框架在很大程度上超過了目前的先進(jìn)技術(shù)。憑借其簡(jiǎn)單性和強(qiáng)大的性能，本文希望這個(gè)框架能夠作為基線以助未來的研究。

論文地址：「鏈接」

標(biāo)題：中山大學(xué) | AlphaFold2-aware protein-DNA binding site prediction using graph transformer（使用圖Transformer進(jìn)行結(jié)合AlphaFold2的蛋白質(zhì)-DNA結(jié)合位點(diǎn)預(yù)測(cè)）

簡(jiǎn)介：蛋白質(zhì)與DNA的相互作用在生物系統(tǒng)中起著至關(guān)重要的作用，確定蛋白質(zhì)與DNA的結(jié)合位點(diǎn)是對(duì)各種生物活動(dòng)，如轉(zhuǎn)錄和修復(fù)，進(jìn)行機(jī)理理解和設(shè)計(jì)新型藥物的第一步?，F(xiàn)有的基于序列的方法只考慮了順序相鄰的上下文特征，這對(duì)捕捉空間信息是有限的。對(duì)此本文提出GraphSite，作者將結(jié)合位點(diǎn)預(yù)測(cè)問題轉(zhuǎn)化為圖節(jié)點(diǎn)分類任務(wù)，并采用基于Transformer的預(yù)訓(xùn)練模型，通過AlphaFold2預(yù)測(cè)結(jié)構(gòu)，將蛋白質(zhì)結(jié)構(gòu)信息、AlphaFold2中Evoformer的表征和序列進(jìn)化信息考慮在內(nèi)實(shí)現(xiàn)DNA結(jié)合殘基的識(shí)別。GraphSite大大改善了基于序列和結(jié)構(gòu)的最新方法，并且在181種蛋白質(zhì)的獨(dú)立測(cè)試集上得到進(jìn)一步證實(shí)，在AUPR和MCC上分別超過了最先進(jìn)的基于結(jié)構(gòu)的方法16.4%和11.2%。

論文地址：「鏈接」

標(biāo)題：耶魯 | Pipeline for retrieval of COVID-19 immune signatures（檢索COVID-19免疫特征的流程）

簡(jiǎn)介：隨著生物醫(yī)學(xué)文獻(xiàn)出版速度的加快，檢索其中的特定的科學(xué)信息變得更有意義。在新冠流行的大背景下，有效地檢索病毒免疫特征，即生物標(biāo)志物，可以幫助了解不同的SARS-CoV-2感染的免疫反應(yīng)機(jī)制。對(duì)此，本文構(gòu)建了一個(gè)系統(tǒng)的流程來識(shí)別和提取結(jié)構(gòu)化的COVID-19免疫特征。具體而言，作者使用基于SPECTER預(yù)訓(xùn)練的生物文本嵌入，配合SVM分類器來自動(dòng)識(shí)別含有免疫特征的論文，并進(jìn)一步對(duì)這些論文進(jìn)行半自動(dòng)查詢流程構(gòu)建，檢索特征信息。此外，基于預(yù)訓(xùn)練嵌入的流程也可確定免疫特征的類型，比如基因表達(dá)與其他類型的分析。通過這種方法，部分自動(dòng)化的文獻(xiàn)挖掘可以幫助快速創(chuàng)建半結(jié)構(gòu)化的知識(shí)庫，用于自動(dòng)分析新出現(xiàn)的健康威脅。

論文地址：「鏈接」

資源推薦

標(biāo)題：孟加拉國工程技術(shù)大學(xué)、加州大學(xué)洛杉磯分校等 | CrossSum:超越 1500 多個(gè)語言對(duì)的以英語為中心的跨語言抽象文本摘要數(shù)據(jù)集

簡(jiǎn)介：作者提供了 CrossSum：一個(gè)包含 165 萬個(gè)跨語言文章摘要樣本、包含 45 種語言的 1500 多個(gè)語言對(duì)的大規(guī)模數(shù)據(jù)集。基于多語言 XL-Sum 數(shù)據(jù)集，并使用與語言無關(guān)的表示模型通過跨語言檢索來對(duì)齊以不同語言編寫的相同文章，作者提出了一種多階段數(shù)據(jù)采樣算法并微調(diào)多語言預(yù)訓(xùn)練模型mT5。實(shí)驗(yàn)結(jié)果表明在 CrossSum 上微調(diào)的模型優(yōu)于摘要+翻譯基線。

論文地址：「鏈接」

資源下載：https://github.com/csebuetnlp/CrossSum

【關(guān)于轉(zhuǎn)載】本文轉(zhuǎn)載于公眾號(hào)“智源社區(qū)”，僅用于學(xué)術(shù)分享，有任何問題請(qǐng)與我們聯(lián)系：report@aminer.cn

四、關(guān)于UEFI啟動(dòng)+GPT分區(qū) 的一些經(jīng)驗(yàn)

隨著時(shí)代和科技的發(fā)展，電腦越來越普及，似乎人人都可以張嘴就說“我懂電腦”，但是總有一些看起來完全不懂但實(shí)際上非?；A(chǔ)的東西讓“懂”與“不懂”清晰地劃清界限。比如UEFI+GPT就是其中之一。那些之前認(rèn)為自己已經(jīng)精通電腦的人，遇到這個(gè)東西，忽然發(fā)現(xiàn)自己連以前自以為駕輕就熟的分區(qū)、裝系統(tǒng) 都不會(huì)了。

盡管UEFI以及GPT從誕生迄今已經(jīng) 十余年了，但是對(duì)于絕大多數(shù)人來講它們是完全陌生的，甚至根本就不知道還有這種東西。

但是由于 Windows 8操作系統(tǒng)的面世，預(yù)裝Windows8的電腦開始統(tǒng)一采用UEFI+GPT，很多人被迫接觸到，感覺就像突然從天上掉下來的東西一樣，無所適從，一籌莫展——“這到底是個(gè)什么東西呢？”

一旦出現(xiàn)系統(tǒng)問題，唯一能做的解決辦法除了品牌機(jī)自帶的系統(tǒng)還原，最大能力不過就是把UEFI關(guān)閉，把硬盤從GPT再轉(zhuǎn)成MBR，從而徹底毀掉UEFI+GPT的優(yōu)勢(shì)，重新回到陳舊落后的BIOS+MBR的系統(tǒng)安裝和運(yùn)行方式上來。而每臺(tái)電腦的具體情況又不盡相同，有時(shí)候即使想用BIOS+MBR也不是肯定能成功的——“我該怎么辦??？”

正文：

之前很長一段時(shí)間對(duì)UEFI+GPT沒有頭緒，有種無處下手的感覺，雖然UEFI+GPT安裝系統(tǒng)一直沒遇到什么障礙，但是即使查閱了相當(dāng)數(shù)量的資料，在認(rèn)識(shí)上對(duì)于UEFI+GPT也沒有一個(gè)完整的概念，總覺得這是一個(gè)很難理解的東西，不得要領(lǐng)。不像最初接觸BIOS+MBR的時(shí)候那么容易入門直至熟練操作。

先說關(guān)于什么是UEFI和GPT，在此就不做詳解了，感興趣的都了解，不感興趣的說了也沒什么用處。只說一點(diǎn)最基本的，MBR分區(qū)結(jié)構(gòu)只能支持到2.2T的硬盤，超過2.2T就必須采用GPT分區(qū)，而就Windows而言，采用了GPT的硬盤，要想安裝并啟動(dòng)Windows操作系統(tǒng)，只能選擇高于XP的64位操作系統(tǒng)，并且采用UEFI方式安裝、引導(dǎo)，否則無法啟動(dòng)，而包括XP在內(nèi)及其之前的32位操作系統(tǒng)完全不支持GPT，別說安裝、引導(dǎo)系統(tǒng)，直接無法識(shí)別。3T硬盤時(shí)代并不遙遠(yuǎn)，要想正常使用你的電腦，這就是采用UEFI+GPT的必要性。

而最關(guān)鍵之處在于，照目前的形勢(shì)來看，由于預(yù)裝Windows8電腦的推動(dòng)，UEFI+GPT已經(jīng)是大勢(shì)所趨，與是否2.2T以上硬盤也已經(jīng)沒什么直接關(guān)系，也許就在不久之后的某一天開始所有的電腦全部使用UEFI單一啟動(dòng)，不會(huì)再兼容傳統(tǒng)BIOS。

再說一下關(guān)于BIOS+MBR，從接觸電腦十幾年來，一直都是用的這種組合，直至今日，不敢說對(duì)此有多么了解，最起碼在日常操作中基本無障礙了。比如：Windows各個(gè)版本甚至再+ Linux +Mac的混合安裝、引導(dǎo)駕輕就熟，任意順序安裝，任意創(chuàng)建、修復(fù)引導(dǎo)，多硬盤混合引導(dǎo)，分區(qū)表損壞、主引導(dǎo)記錄損壞的修復(fù)、重建等等，都不存在任何問題。

而從一接觸UEFI+GPT，總是感覺這個(gè)東西無法理解。甚至一籌莫展，哪怕是引導(dǎo)損壞這樣之前在BIOS+MBR里不叫事的事情，面對(duì)UEFI+GPT都束手無策，查了很多資料，除了重裝系統(tǒng)，在國內(nèi)網(wǎng)絡(luò)范圍內(nèi)，全網(wǎng)竟然找不到任何一篇具體解決問題的文章。現(xiàn)在回想，很長一段時(shí)間內(nèi)都無法理解這些問題，很多莫名其妙的所謂專業(yè)文章的誤導(dǎo)在其中作了重要貢獻(xiàn)。

后來索性拋開所有的那些亂七八糟的觀點(diǎn)、定義，按照自己的想法去摸索，經(jīng)過近十天，幾十遍重裝系統(tǒng)，反復(fù)的假設(shè)、實(shí)驗(yàn)，總算是對(duì)UEFI+GPT有了一個(gè)總體的概念和較為清晰的認(rèn)識(shí)，最關(guān)鍵的在于能夠隨意進(jìn)行UEFI+GPT的安裝和引導(dǎo)修復(fù)了，這是最重要的，個(gè)人觀點(diǎn)一直都是，必須從實(shí)際出發(fā)，即使了解的再多，什么問題也解決不了，紙上談兵，一切等于零。可以毫不夸張的說，至少目前為止，本文是全網(wǎng)絡(luò)唯一一篇對(duì)UEFI+GPT進(jìn)行實(shí)用性介紹和以及解決實(shí)際問題的文章。

關(guān)于UEFI的優(yōu)越特性，比如可操作性、安全性、兼容性、可擴(kuò)展性之類的問題，在此不再多說，這是開發(fā)人員的事情，和我沒有關(guān)系。僅僅總結(jié)幾點(diǎn)兩者在系統(tǒng)安裝及引導(dǎo)方式方面一些異同，幫助同樣有此困惑的人理解這個(gè)東西：

【重要提示：

本文旨在“授之以漁”，力求融會(huì)貫通，知其然更知其所以然。因此本文既不包含網(wǎng)絡(luò)上“技術(shù)文章八股文”式的定義、理論的堆砌和釋義，更不是“小白必備”的傻瓜式手把手操作教程，如果對(duì)以上兩種千篇一律的所謂“技術(shù)文章”有偏執(zhí)的愛好，請(qǐng)務(wù)必及時(shí)停止瀏覽，另尋其好。】

不同點(diǎn)：

1.BIOS+MBR安裝系統(tǒng)要求硬盤只要存在非隱藏、活動(dòng)的主分區(qū)就可以了；而UEFI+GPT要求硬盤上除了存在ESP分區(qū)，還必須存在至少一個(gè)主分區(qū)

2.BIOS+MBR一旦系統(tǒng)安裝好之后，如果系統(tǒng)引導(dǎo)文件在單獨(dú)的分區(qū)，此分區(qū)可以在操作系統(tǒng)中可見，也可以設(shè)置此分區(qū)為隱藏，系統(tǒng)都可以正常啟動(dòng)；而UEFI+GPT系統(tǒng)引導(dǎo)文件所在的ESP分區(qū)在操作系統(tǒng)中為不可見

3.BIOS+MBR啟動(dòng)要求的活動(dòng)的主分區(qū)不是唯一固定的，可以任意設(shè)定某一分區(qū)為活動(dòng)的主分區(qū)，然后MBR就可以通過分區(qū)表指引操作系統(tǒng)從此分區(qū)啟動(dòng)，也就是說，可以在任意分區(qū)（主分區(qū)無論是否活動(dòng)或者擴(kuò)展分區(qū)）安裝操作系統(tǒng)，只要存在任意的活動(dòng)主分區(qū)，就可以從此分區(qū)啟動(dòng)操作系統(tǒng)；而UEFI+GPT只能把系統(tǒng)引導(dǎo)文件放置在ESP分區(qū)

4.BIOS+MBR的系統(tǒng)引導(dǎo)文件可以和系統(tǒng)文件在同一分區(qū)的根目錄，也可以不與系統(tǒng)文件同一分區(qū)，只要系統(tǒng)引導(dǎo)文件所在分區(qū)為活動(dòng)的主分區(qū)即可啟動(dòng)操作系統(tǒng)；而UEFI+GPT只能把系統(tǒng)引導(dǎo)文件放置在ESP分區(qū)，且操作系統(tǒng)必須在另外的主分區(qū)，也就是說， UEFI+GPT強(qiáng)制要求系統(tǒng)啟動(dòng)文件與系統(tǒng)文件必須分離，不在同一分區(qū)。

相同點(diǎn)：

1.BIOS+MBR和UEFI+GPT的系統(tǒng)引導(dǎo)文件都可以放置在單獨(dú)的分區(qū)，這一點(diǎn)在上面的第4點(diǎn)里已經(jīng)說的很清楚

2.BIOS+MBR的系統(tǒng)引導(dǎo)文件所在的活動(dòng)主分區(qū)位置不是固定的，可以隨意設(shè)置任意分區(qū)滿足此條件，UEFI+GPT的ESP的位置也是可以隨意設(shè)置的，在硬盤起始位置、中間位置、末尾，都可以，只要分區(qū)屬性和其中的引導(dǎo)文件正確，就可以引導(dǎo)啟動(dòng)操作系統(tǒng)（參考文中附圖）

3.BIOS+MBR的系統(tǒng)引導(dǎo)文件所在的分區(qū)和UEFI+GPT的ESP分區(qū)都可以分配任意大小，而不是ESP必須100M

4.BIOS+MBR安裝系統(tǒng)所需的非隱藏、活動(dòng)主分區(qū)和UEFI+GPT的系統(tǒng)的ESP分區(qū)，都可以同時(shí)設(shè)置多個(gè)，但是即使有多個(gè)相同屬性的分區(qū)，系統(tǒng)安裝時(shí)安裝程序都是自動(dòng)寫入第一個(gè)，啟動(dòng)時(shí)也都是從第一個(gè)啟動(dòng)（參考文中附圖）

補(bǔ)充：

1.使用BIOS+MBR和UEFI+GPT安裝的系統(tǒng)文件是一模一樣的，唯一的區(qū)別只是引導(dǎo)方式的不同，因此使用GHOST手動(dòng)備份的系統(tǒng)，MBR和GPT可以任意交叉還原，只要做好引導(dǎo)修復(fù)就沒有任何問題

2.GHOST始終是系統(tǒng)備份還原神器，只要熟練掌握GHOST手動(dòng)操作，至少目前為止Windows系統(tǒng)的范圍之內(nèi)，無論什么版本，無論MBR還是GPT，都可以隨意備份還原。

3.MBR與GPT分區(qū)互轉(zhuǎn)的話，與“刪除所有分區(qū)”以及“全盤格式化”沒有任何必然聯(lián)系，你格式化一萬遍硬盤也還是原來的分區(qū)結(jié)構(gòu)，只有通過轉(zhuǎn)換操作才可以到另一種，而這個(gè)轉(zhuǎn)換操作與“刪除所有分區(qū)”以及“全盤格式化”沒什么關(guān)系。

著重強(qiáng)調(diào)一點(diǎn)：

以上所有經(jīng)驗(yàn)均基于UEFI+GPT的組合，而實(shí)際上， UEFI啟動(dòng)（Windows操作系統(tǒng)）的話，并不強(qiáng)制要求硬盤必須為GPT分區(qū)，而是只要硬盤上存在EFI啟動(dòng)文件且位于FAT（16/32）分區(qū)就可以了（UEFI無法從NTFS分區(qū)啟動(dòng)）。因此如果是小于2.2T的硬盤，不必非得轉(zhuǎn)換成GPT也可以引導(dǎo)系統(tǒng)啟動(dòng)。也就是說，UEFI+MBR也是可行的，而GPT硬盤的話，則必須使用UEFI引導(dǎo)，BIOS無法原生引導(dǎo)GPT硬盤上的操作系統(tǒng)（Windows）。

關(guān)于這一點(diǎn)，如果感覺不能理解的話，可以通過以下具體應(yīng)用來參考。

注：

綜觀網(wǎng)上那些關(guān)于UEFI的所謂技術(shù)類文章，除了毫無實(shí)用價(jià)值和實(shí)際意義，而且都不同程度的存在各種各樣的因循誤導(dǎo)，繼而被以訛傳訛，最終成為一些人堅(jiān)信不疑的“定律”。這樣的誤導(dǎo)主要表現(xiàn)為兩點(diǎn)：

1. 就是剛剛說的，“UEFI啟動(dòng)系統(tǒng)必須是GPT分區(qū)”，這個(gè)已經(jīng)說得很明白了，并且有實(shí)例解析，無需再討論

2. 另外一個(gè)就是不知道從什么時(shí)候什么人開始謠傳的 “UEFI的優(yōu)勢(shì)就是啟動(dòng)速度快” 或者 “UEFI啟動(dòng)比傳統(tǒng)BIOS啟動(dòng)速度快”。無論UEFI還是GPT，與電腦啟動(dòng)速度沒有任何必然聯(lián)系。或者說，只要硬件環(huán)境相同、系統(tǒng)一樣，無論UEFI+GPT安裝還是BIOS+MBR安裝系統(tǒng)，啟動(dòng)速度沒有區(qū)別

GPT

MBR

附：部分Windows桌面操作系統(tǒng)對(duì)GPT的支持

數(shù)據(jù)讀寫系統(tǒng)啟動(dòng)

WindowsXP32位不支持GPT不支持GPT

WindowsXP64位支持GPT不支持GPT

WindowsVista32位支持GPT不支持GPT

WindowsVista64位支持GPT支持GPT（需UEFI）

Windows732位支持GPT不支持GPT

Windows764位支持GPT支持GPT（需UEFI）

Windows832位支持GPT不支持GPT

Windows864位支持GPT支持GPT（需UEFI）

有了以上的經(jīng)驗(yàn)總結(jié)，就可以輕松解決以下問題了：

1.UEFI+GPT環(huán)境下以任意方式安裝操作系統(tǒng)（單系統(tǒng)或者多系統(tǒng)）。這個(gè)不必詳解了

2.最主要的問題： UEFI+GPT引導(dǎo)修復(fù)操作（EFI引導(dǎo)文件損壞、ESP分區(qū)損壞或者丟失之后手動(dòng)重建EFI引導(dǎo)等等）。這個(gè)在此也不做詳解，這是這段時(shí)間反復(fù)研究、實(shí)踐的最重要成果，因此姑且算是有所保留賣個(gè)關(guān)子吧，如果是結(jié)合以上幾點(diǎn)經(jīng)驗(yàn)總結(jié)，對(duì)UEFI+GPT有一定的了解之后，應(yīng)該不難揣摩出辦法

3. 如果主板不支持UEFI，使用折中的辦法來解決大硬盤使用問題，這個(gè)問題以前我也已經(jīng)多次提過。

第一種辦法就是使用多塊硬盤，MBR+GPT組合，MBR 硬盤作為啟動(dòng)引導(dǎo)盤。

小于2.2T的硬盤采用MBR，大于2.2T的硬盤采用GPT，這樣的話，解決方案就很靈活了，可以根據(jù)以上所列相同點(diǎn)的第1條和補(bǔ)充里面第2條，使用MBR硬盤建一個(gè)非隱藏活動(dòng)主分區(qū)，放置系統(tǒng)引導(dǎo)文件，然后將系統(tǒng)安裝在MBR硬盤或者GPT硬盤都可以，無論單系統(tǒng)還是多系統(tǒng)都無所謂，兩塊硬盤交叉安裝操作系統(tǒng)也沒有任何問題

強(qiáng)調(diào)兩點(diǎn) ：

1.這樣安裝的話不限于64位操作系統(tǒng)及XP以上版本，理論上只要是能對(duì)GPT硬盤進(jìn)行讀寫的系統(tǒng)版本就可以安裝。實(shí)際測(cè)試，32位XP和2003sp1以及之前的版本，電腦事先安裝GPT硬盤的情況下，即使系統(tǒng)安裝在MBR硬盤，原版系統(tǒng)安裝，沒有問題，如果是Ghost系統(tǒng)，有可能出現(xiàn)卡死或者藍(lán)屏等問題導(dǎo)致無法順利安裝；先在MBR硬盤安裝好系統(tǒng)，然后再裝GPT硬盤，無論原版還是Ghost系統(tǒng)都沒有問題，只是GPT分區(qū)無法識(shí)別（解決方法很簡(jiǎn)單，就是使用2003sp2的disk.sys文件替換到以上系統(tǒng)，就可以完美識(shí)別GPT分區(qū)，此法簡(jiǎn)單易操作，且不涉及系統(tǒng)穩(wěn)定問題，感興趣的話可以自行搜索）。64位XP安裝在MBR硬盤，引導(dǎo)、啟動(dòng)都沒有問題，安裝在GPT硬盤無法引導(dǎo)。其他系統(tǒng)無論32位還是64位，無論安裝在MBR還是GPT，都可以正常引導(dǎo)啟動(dòng)；

2.BIOS安裝系統(tǒng)到GPT硬盤僅限于Ghost方式，Ghost解壓完畢后手動(dòng)修復(fù)引導(dǎo)即可。

第二種辦法是單塊大于2.2T的硬盤+U盤或者光盤組合

使用GPT分區(qū)結(jié)構(gòu)對(duì)硬盤進(jìn)行分區(qū)，是否創(chuàng)建ESP分區(qū)都無所謂，因?yàn)橹靼宀恢С諹EFI，創(chuàng)建此分區(qū)也沒什么用，全憑個(gè)人愛好了。然后只能使用Ghost方式解壓安裝操作系統(tǒng)到硬盤，無論單系統(tǒng)還是多系統(tǒng)，全部安裝完畢后，準(zhǔn)備一個(gè)U盤，大小無所謂，只要不小于十幾M就行，使用分區(qū)軟件設(shè)為活動(dòng)主分區(qū)，插在電腦上。進(jìn)PE（2003sp1以上版本），手動(dòng)或者使用工具軟件修復(fù)單系統(tǒng)或者多系統(tǒng)引導(dǎo)，將引導(dǎo)文件寫入U(xiǎn)盤。然后就可以使用此U盤啟動(dòng)所安裝的單系統(tǒng)或者多系統(tǒng)了。此方法實(shí)際上就是用U盤代替了第一種方法中的小硬盤而已，沒什么本質(zhì)區(qū)別。（這個(gè)方法大概10年前我就在電腦論壇發(fā)過帖子，當(dāng)時(shí)考慮的是用U盤做一個(gè) 系統(tǒng)啟動(dòng)鑰匙，因?yàn)橄到y(tǒng)引導(dǎo)文件在U盤上，電腦如果不插這個(gè)U盤是無法啟動(dòng)的。MBR硬盤系統(tǒng)：Windows864位+Windows732位+WindowsXP32位，GPT硬盤系統(tǒng)：Windows832位+Windows764位+WindowsVista32位，測(cè)試環(huán)境：雜牌945主板、32M老U盤，測(cè)試通過。）

另外還可以再使用光盤來代替U盤，具體方法說起來更簡(jiǎn)單，用軟件創(chuàng)建一個(gè)可啟動(dòng)光盤（創(chuàng)建方法自行查詢，會(huì)做的不用講，壓根沒接觸過的，另開帖子專門講也不一定看得懂），然后將上面U盤里的系統(tǒng)啟動(dòng)文件加進(jìn)去刻錄就可以了。然后使用此光盤啟動(dòng)電腦，效果和U盤是一樣的。此方法僅僅作為一種可行性的介紹，不推薦使用，U盤比這個(gè)方便的多，沒必要多此一舉。

備注：使用此方法，理論上來講凡是可以對(duì)GPT進(jìn)行讀寫的系統(tǒng)都適用，但實(shí)際上XP以上系統(tǒng)無論32位還是64位操作系統(tǒng)全部測(cè)試可行，但是2003sp1及XP64位這些可以讀寫GPT的系統(tǒng)也不行，這個(gè)不知道是由于NT5.X的ntldr引導(dǎo)機(jī)制還是其他的什么原因，有知道原因的朋友不吝賜教！

注：

1.除專門標(biāo)明“Ghost系統(tǒng)”，本文所提及的系統(tǒng)安裝均為微軟原版Windows系統(tǒng)，不包含任何修改版本

2.非UEFI主板安裝原版系統(tǒng)到GPT磁盤，只能采取wim直接解壓到分區(qū)或者先將系統(tǒng)Ghost化，然后解壓安裝的辦法。

3.本文所有結(jié)論全部為反復(fù)多次實(shí)際測(cè)試結(jié)果，不是設(shè)想、假設(shè)，更不是想象或者幻想以及想當(dāng)然的以為

4.本文內(nèi)容已經(jīng)多次修訂和修改，這是個(gè)人的一點(diǎn)經(jīng)驗(yàn)總結(jié)，難免有紕漏以及表達(dá)不準(zhǔn)確之處，望有相關(guān)經(jīng)驗(yàn)的朋友給予更多幫助

附注：

鑒于許多的網(wǎng)友瀏覽本文之后提出如下問題，因此酷站網(wǎng)軟特集中在此做如下補(bǔ)充說明，不再過多贅述及一一答復(fù)：

原本很早之前就寫了一篇關(guān)于預(yù)裝win8的電腦改其他系統(tǒng)以及安裝多系統(tǒng) 的文章，雖然經(jīng)過多次修改，最后還是放在電腦里沒有在任何地方發(fā)表出來。

雖然那是親自實(shí)踐過多個(gè)品牌和型號(hào) 的預(yù)裝機(jī)器之后總結(jié)出來的經(jīng)驗(yàn)，但是仍然發(fā)現(xiàn) 在其他品牌和型號(hào)的電腦上根本無法通用。而我不可能也沒條件遍試所有的機(jī)器，因此此篇文章就此擱淺。

因此我在我的這篇文章里面沒有涉及任何預(yù)裝win8系統(tǒng)的電腦改系統(tǒng) 的問題。

這是我的一貫態(tài)度，我所寫的都是我親身實(shí)踐、確實(shí)可行、不需討論的，在我這里不可能出現(xiàn)“我覺得”“我認(rèn)為”“應(yīng)該是”這類想象或者幻想的東西。

（在此還是要特別強(qiáng)調(diào)幾點(diǎn)：

1.這個(gè)意思并不是說“預(yù)裝win8的電腦改其他系統(tǒng)以及安裝多系統(tǒng)”是完全不可行的，只是目前為止還沒找到通用的方法。也就是說可能在某個(gè)品牌和型號(hào)的電腦上按照某種方法安裝非常順利，但是同樣的方法用在其他品牌和型號(hào)的電腦上可能完全不適用。

2.不管是用何種方法，比如Ghost、PE、nt6 hdd installer、快捷安裝器、直接setup、在vhd裝、全盤轉(zhuǎn)換成mbr、手動(dòng)寫引導(dǎo)等等方法，將其他系統(tǒng)裝進(jìn)硬盤，只要通過這塊主板啟動(dòng)，就要面對(duì)安裝失敗的問題，因此制約因素在主板上，并不在于采用什么方式安裝系統(tǒng)

https://www.kzwr.com/article/110118

以上就是關(guān)于gpt2訓(xùn)練寫材料相關(guān)問題的回答。希望能幫到你，如有更多相關(guān)問題，您也可以聯(lián)系我們的客服進(jìn)行咨詢，客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。