什麼是 GPT？

了解建置在生成式預先訓練轉換器 (GPT) 上的 AI 模型如何解譯和建立擬人化內容。

探索 AI 服務開始使用 Azure

AI 中 GPT 的角色

GPT 代表生成式預先訓練轉換器，是一系列分析資料、解譯以及產生擬人化文字、影像和音效的神經網路模型。人員和組織使用 GPT 來摘要長文字和會議、翻譯語言、建立書面溝通、撰寫程式碼、產生影像，以及使用交談語氣回答問題。

關鍵要點

GPT 是一種深度學習神經網路，可分析由自然語言、影像或音效所組成的提示，以預測最佳的可能回應。

藉由重複多次預測流程，GPT 就能建立擬人化內容，並參與長時間交談。

GPT 是以轉換器架構為基礎，此架構將文字、影像和音效轉換成數學，以解譯內容的意義。
GPT 有效的原因在於，其經過大型資料集 (包括大型文字語料庫) 的訓練。
透過簡化研究、減少忙碌工作、加速撰寫文字和電腦程式碼，以及提升創造力，GPT 正在轉換人們完成工作的方式。
一些 GPT 使用案例包括聊天機器人、內容建立、情緒分析、電腦程式碼建立、資料分析和會議摘要。
OpenAI 會繼續投資 GPT，在未來，組織可預期取得更好的輸出、更高的透明度、較少偏差，以及更高的正確性。

GPT 是什麼，以及其運作方式

GPT 是一種深度學習神經網路，可根據輸入的解釋來分析由自然語言、影像或音效所組成的提示，以預測最佳的可能回應。為了執行這項工作，GPT 在使用數千億個參數的大型資料集上進行訓練。GPT 參考了學習如何權衡順序中不同要素的重要性，例如句子中的單字，或是影像和音效的一部分。GPT 藉由權衡推斷相關性和內容，以產生與提示相關的有意義內容。

GPT 的記錄

在 2018 年，OpenAI 發行了第一代 GPT，其建置於該架構 GPT-1 使用了超過 15 億個參數進行訓練，而且可以產生文字、回答問題、翻譯語言和摘要文字，但在理解內容方面遇到困難，並且難以處理較長的文字段落。

此後每隔兩年，OpenAI 會發行新版 GPT，而每一個版本都在更大規模的資料集上進行訓練。隨著每次發行，技術會改善其了解內容的能力，並流暢且連貫地撰寫。GPT 會持續新增技能，例如建立電腦程式碼、在幾乎沒有範例的情況下執行工作，以及分析大量資料。

訓練概觀

為了有效執行，GPT 必須能夠剖析及解譯大量提示和要求。GPT 會使用未受監督的深入學習 (機器學習的子集) 訓練大型資料集，包括大型語料庫。在不受監督的學習中，模型會教導自己在無需人類指引的情況下，在未標記的資料中尋找模式。GPT 會使用電腦視覺辨識和了解影像中的對象和人員。

GPT 也可以針對非常特定的案例 (例如銀行或法律) 進行訓練。在這些情況下會使用監督式學習，這表示訓練資料是由人類標示。

基本 GPT 架構

GPT 建置於轉換器架構，其使用自我注意機制來分析提示的不同要素，以及彼此之間的關係，以解譯內容與意義。例如，「雲端」這個字可以指的是天空中凝結的水氣，或是作為技術平台的雲端運算。人員與 GPT 會透過評估句子或段落中其他單字的意義，以判斷適當的單字版本。

轉換器架構可透過將文字和其意義轉換成數學，以執行這項功能。其會將文字、影像和音效分成較小部分，這些部分稱為權杖。向量會指派給權杖，以編碼意義。然後，編碼向量 (稱作內嵌) 會透過注意區塊來傳送，以交換資訊並適當地更新向量。一旦 GPT 判斷提示的意義，就會產生可能性分配形式的預測，並建議順序中的下一個單字、影像或音效。藉由重複此流程，GPT 即可撰寫較長的文字段落或延續交談。

重要要素

架構由兩個部分組成：

編碼器。編碼器是系統的一部分，將文字、影像和音效分成數學內嵌。每個內嵌會指派一個權數，以指示與內容和意義的相關性。然後，內嵌會使用自我注意機制相互比較，以進一步精簡意義。
解碼器。解碼器會使用向量和權數來判斷可能的輸出，並預測最佳輸出。由於最新版 GPT 已在數個資料上進行訓練，因此已相當習慣使用此流程來撰寫流暢且連貫的文字。

GPT 的優點和挑戰

GPT 有可能改變您和組織的工作方式，協助您節省時間與金錢。但使用這項技術時，若沒有縝密的防護機制，依然會帶有風險。經常檢查您從 GPT 或其他任何 AI 系統取得的資訊至關重要，以確認資訊正確且符合規範。

優點

簡化研究。GPT 可以處理網際網路和/或其他資料源，並提供發現和來源的摘要 (如有需要)。
增強電腦程式碼。開發人員使用 GPT 來協助撰寫新程式碼，或簡化他們撰寫過的任何代碼。
撰寫速度更快。其中一種最常用的 GPT 使用方式就是作為書寫工具。GPT 可以快速整合許多資訊，並產生報告、部落格文章、電子郵件及其他書面教材。
減少忙碌工作。GPT 可以執行摘要會議、翻譯語言和回答問題等工作，讓您可以有更多時間專注於更重要的工作。
提升創意。除了撰寫詩歌，GPT 還可以快速產生許多不同的想法，使其成為進行腦力激蕩的好工具。
根據您的業務自訂。GPT 可以透過訓練滿足不同組織和產業的獨特需求。

挑戰

偏差。如同所有仰賴人為建立資料的 AI 模型，該資料中的固有偏差可能會包含在 GPT 輸出中。例如，AI 模型可能會假設社會的某些角色 (例如科學家) 僅由男性擔任，因為大部分歷史資料都是關於男性科學家。
不正確。因為 GPT 是根據預測產生輸出，所以不一定是正確的。要求 GPT 參考已知資料或根據組織知識庫進行訓練可以有所幫助，但依然需要透過人工審查確保正確性。
網路安全性。惡意行為體正在使用 GPT 和其他 AI 模型來建立令人信服的網路釣魚電子郵件、開發惡意程式碼，以及分析組織的弱點。訓練員工識別網路釣魚電子郵件有助於降低組織的風險。此外，實作可偵測異常和封鎖惡意代碼的網路安全性解決方案也至關重要。
侵犯智慧財產權。GPT 的輸出可能包含由其他人或組織所建立的影像或副本。發佈 AI 建立的內容之前，請確認組織具有內容的權限，且適當地使用引文。
無效提示。從 GPT 取得良好輸出需要結構良好的提示。若要開發提供期望結果的提示，可能需要訓練和試驗。
不可穿透性。因為 GPT 是使用深度學習模型所建立，所以很難知道它如何產生回應，這也是另一個在使用之前必須仔細檢查輸出的原因。

常見的 GPT 使用案例

GPT 模型可以執行廣泛的工作，而組織會持續尋找新的方法，以在自己的組織中運用這些模型。以下是一些可嘗試的方法：

內容創作。使用 GPT 來協助您撰寫副本、產生迷因以及影像。

聊天機器人和交談代理程式。因為 GPT 可以理解並使用自然語言回應，所以是聊天機器人的出色工具。

語言翻譯。GPT 能正確翻譯語言，不過最好在將語言張貼到網站或其他公用空間之前，先向母語人士確認其正確性。

情感分析。GPT 可協助分析客戶評論、社交媒體貼文或其他文字，以了解使用者對於您的品牌、產品和服務的滿意度。

建議。在旅遊之前，考慮向 GPT 詢問推薦拜訪的餐廳、旅館和景點。使用正確的參數可協助開發一系列優質選項。

研究。由於 GPT 擅長摘要資訊，因此也是很好的研究工具。GPT 可以協助減少需要檢閱的網站、報告和其他文件數量，讓您更快找到所需資訊。請務必詢問來源，以便驗證取得的資訊。

會議和文件摘要。GPT 可提供會議摘要或長文件，以節省大量時間。

程式碼建立。GPT 知道許多電腦語言，而且可以產生相關程式碼片段，或以交談語言說明程式碼執行的工作。

資料分析。透過 GPT 的協助，在大型資料集中發現趨勢和重要深入解析。

GPT 的未來

OpenAI 持續在 GPT 中投入鉅資。GPT-4o 於 2024 年發行。名稱中的「o」代表全能，因為模型可以處理和產生音訊、文字和視覺效果。GPT-4o mini 是支援文字和音訊的較小模型。其執行效果比先前的 GPT 模型 (例如 GPT-3.5) 更好，同時更具成本效益。

此外，您可以持續關注模型效率與功能的改善，例如：

具備更佳效能的較大模型。未來的 GPT 反覆運算可能更大，並在更多參數上進行訓練，使 GPT 以更細膩和複雜的方式理解和產生內容。
提升微調和自訂。將會有更進階的技術來微調特定網域或產業的模型，並針對特定領域，提升其產生量身打造相關且正確內容的能力。每個仁也可以根據自己的需求自訂模型。
進一步了解內容。了解和管理長期相依性，可協助模型提供更精確且內容更適當的回應。
更進階的多模式功能。模型將更了解如何根據各種輸入 (例如文字、影像和音訊) 來理解和產生內容。
增強可說明性和可解譯性。致力於讓 GPT 模型的決策更透明，提供如何產生回應和輸出背後原理的深入解析。
道德和負責 AI 開發。持續的研究與開發將著重於減少 GPT 模型中的偏差，以確保更多公正和公平的輸出。優先考慮偵測和緩解有害內容、錯誤資訊和不當輸出的增強方法，以確保負責方式使用技術。

資源

深入了解 Microsoft AI

教育版

開創您的技術職涯

探索可協助改善程式設計技巧的資源，並尋找 AI 中的工作。

深入了解

Azure 資源

充分運用您的 Azure 服務

了解如何有效使用 Azure 服務與一系列工具，例如影片、程式碼片段和技術白皮書。

深入了解

Microsoft Learn

隨時掌握 AI 的最新消息

探索 AI 的最新趨勢和訓練。

深入了解

GPT 是一個使用深度學習來解譯和產生擬人化文字、影像和聲音的生成式 AI 模型。
轉換器架構是一種深度學習神經網路，可讓 AI 模型 (例如 GPT) 解譯自然語言，並產生原始文字、影像和音效。其會分析輸入的不同要素和其彼此之間的關係來編碼內容與意義，以完成工作。這可讓轉換器架構預測文字區塊、影像或音效接下來的內容。
GPT 是使用深度學習來解譯擬人化文字、影像和音效的 AI 模型，進而產生新內容、提供資料分析或摘要資訊。GPT 有效地執行上述以及其他工作，因為其已在使用數千億個參數的大型資料集上進行訓練。預先訓練表示資料在公開發行之前已在此資料上進行訓練。

探索 Azure 入口網站

什麼是 GPT？

AI 中 GPT 的角色

關鍵要點

GPT 是什麼，以及其運作方式

GPT 的記錄

訓練概觀

基本 GPT 架構

重要要素

架構由兩個部分組成：

GPT 的優點和挑戰

優點

挑戰

常見的 GPT 使用案例

GPT 的未來

深入了解 Microsoft AI

開創您的技術職涯

充分運用您的 Azure 服務

隨時掌握 AI 的最新消息

常見問題集

GPT 是生成式 AI 嗎？

什麼是 AI 轉換器？

預先訓練在 GPT 中的意義為何？