摘要:AIGC和多模態(tài)知識(shí)圖譜(MMKG)中的知識(shí)獲取又是怎么實(shí)現(xiàn)的呢?他們之間有什么關(guān)聯(lián)呢?
本文分享自華為云社區(qū)《GPT-4發(fā)布,AIGC時(shí)代的多模態(tài)還能走多遠(yuǎn)?系列之四 AIGC for MMKG》,作者:碼上開(kāi)花_Lancer。
與傳統(tǒng)知識(shí)圖譜不同,MMKG以多模態(tài)數(shù)據(jù)作為源頭,從多方面描述實(shí)體和關(guān)系,構(gòu)建出一個(gè)可以跨越多模態(tài)的知識(shí)體系。在MMKG中,多模態(tài)數(shù)據(jù)不僅僅作為文字符號(hào)實(shí)體的關(guān)聯(lián)屬性存在,還可以作為圖譜中的實(shí)體存在,可與現(xiàn)有實(shí)體發(fā)生廣泛關(guān)聯(lián)。 MMKG的優(yōu)勢(shì)在于它能夠消除多模態(tài)數(shù)據(jù)的異構(gòu)性,將它們有機(jī)地結(jié)合在一起,使得系統(tǒng)能夠?qū)崿F(xiàn)對(duì)多模態(tài)數(shù)據(jù)的更加全面和深入的理解。AIGC(生成式AI)可以利用多模態(tài)知識(shí)圖譜中的信息來(lái)生成新的內(nèi)容。例如AIGC(生成式AI)可以根據(jù)MMKG的文本和圖像信息,生成描述某個(gè)實(shí)體或者概念的新文本、圖像或視頻。這種結(jié)合可以提高生成內(nèi)容的質(zhì)量和準(zhǔn)確性,所以多模態(tài)知識(shí)圖譜提供了豐富的上下文信息,有助于生成式AI更好的理解和描述目標(biāo)內(nèi)容。那么,AIGC和多模態(tài)知識(shí)圖譜(MMKG)中的知識(shí)獲取又是怎么實(shí)現(xiàn)的呢?他們之間有什么關(guān)聯(lián)呢?
(相關(guān)資料圖)
01 大模型知識(shí)抽?。豪肞rompt機(jī)制來(lái)獲得多模態(tài)大模型中富含的知識(shí)
大型預(yù)訓(xùn)練模型的興起,知識(shí)知識(shí)獲取已經(jīng)成為當(dāng)前自然語(yǔ)言處理領(lǐng)域的熱門(mén)話題。利用大模型的知識(shí)抽取方法可以幫助我們更好地探索和利用多模態(tài)大模型中豐富的知識(shí)資源。 在知識(shí)抽取的過(guò)程中,Prompt機(jī)制被廣泛應(yīng)用。它通過(guò)給模型提供一些輸入提示,來(lái)引導(dǎo)模型生成對(duì)應(yīng)的輸出序列。這種方法不僅可以在文本方面得到很好的應(yīng)用,也可以在多模態(tài)知識(shí)獲取方面產(chǎn)生卓越的效果。例如,在圖像描述生成領(lǐng)域,我們可以將關(guān)鍵詞或者句子作為prompt輸入,用以指導(dǎo)模型生成適當(dāng)?shù)膱D像描述。
與此類似的,利用Prompt機(jī)制可以讓模型以更優(yōu)秀的方式使用多模態(tài)知識(shí)。通過(guò)針對(duì)特定場(chǎng)景和任務(wù)設(shè)計(jì)的Prompt,模型能夠更精準(zhǔn)地理解和應(yīng)用多模態(tài)知識(shí),從而提高知識(shí)的知識(shí)獲取效率。這種方法的優(yōu)點(diǎn)在于它可以幫助模型理解多模態(tài)數(shù)據(jù)之間的相互關(guān)系,并引導(dǎo)模型實(shí)現(xiàn)跨模態(tài)知識(shí)表示和推理。 利用Prompt機(jī)制進(jìn)行多模態(tài)抽取是一種非常有效的方法,可以顯著提高多模態(tài)大模型的知識(shí)利用效率。同時(shí),這種方法還可以幫助我們更好地理解和應(yīng)用不同類型的知識(shí),從而推動(dòng)自然語(yǔ)言處理技術(shù)的發(fā)展。未來(lái),我們可以進(jìn)一步優(yōu)化Prompt機(jī)制的設(shè)計(jì),以適應(yīng)更多樣化的知識(shí)抽取需求,實(shí)現(xiàn)更高效、準(zhǔn)確和全面的多模態(tài)知識(shí)獲取。
(以上圖片來(lái)自網(wǎng)絡(luò))
02 AIGC為知識(shí)獲取降本增效:零樣本、少樣本、開(kāi)放知識(shí)獲取
隨著自然語(yǔ)言處理技術(shù)的不斷發(fā)展和完善,知識(shí)獲取的效率和成本問(wèn)題逐漸受到人們的關(guān)注。在這個(gè)背景下,AIGC作為知識(shí)獲取方面的重要研究方向,受到了越來(lái)越多的關(guān)注和重視。 在實(shí)際應(yīng)用中,難免會(huì)遇到數(shù)據(jù)量不足的情況,這時(shí)候零樣本或者少樣本學(xué)習(xí)就顯得尤為重要。通過(guò)使用大模型進(jìn)行輔助,可以有效提升模型對(duì)于零樣本或少樣本的學(xué)習(xí)能力,從而降低對(duì)于數(shù)據(jù)量的依賴性,大幅提升知識(shí)抽取的效率。同時(shí),在多模態(tài)知識(shí)的獲取過(guò)程中,大模型也表現(xiàn)出了非常出色的表現(xiàn)。它可以將不同模態(tài)的數(shù)據(jù)進(jìn)行關(guān)聯(lián)推理,從而幫助我們更好地獲取跨模態(tài)知識(shí),提高知識(shí)抽取的全局性和準(zhǔn)確性。 此外,開(kāi)放知識(shí)獲取也是目前研究的熱點(diǎn)之一。傳統(tǒng)的知識(shí)獲取方法需要大量的人工參與,成本高昂且效率低下。而通過(guò)利用大模型進(jìn)行知識(shí)獲取,則可以極大地減少人工成本,提高知識(shí)獲取的效率和準(zhǔn)確度。這使得開(kāi)放知識(shí)獲取變得更加容易,為知識(shí)抽取的自動(dòng)化、高效化奠定了基礎(chǔ) 。
(以上圖片來(lái)自網(wǎng)絡(luò))
03 AIGC為知識(shí)獲取降本增效:顯著增強(qiáng)垂域多模態(tài)知識(shí)獲取能力
如何更加高效地獲取和利用知識(shí)已經(jīng)成為了自然語(yǔ)言處理領(lǐng)域中的一個(gè)非常重要的問(wèn)題,在這個(gè)過(guò)程中,AIGC(增強(qiáng)智能領(lǐng)域)技術(shù)正發(fā)揮著重要的作用,通過(guò)降低知識(shí)獲取的成本、提高獲取效率等方面的優(yōu)化,使得多模態(tài)知識(shí)獲取能力顯著增強(qiáng)。
其中,GPT-4和ChatPDF等大型預(yù)訓(xùn)練模型已經(jīng)表現(xiàn)出了非常強(qiáng)大的領(lǐng)域知識(shí)抽取能力,特別是在基于多模態(tài)文檔抽取方面有著出色的表現(xiàn)。這些模型能夠通過(guò)深度學(xué)習(xí)等技術(shù),從海量的文本和圖像中快速篩選和抽取有用的信息,并進(jìn)行分類、歸納等操作,為用戶提供精準(zhǔn)、有效的知識(shí)支持。
(以上圖片來(lái)自網(wǎng)絡(luò))
04 AIGC助圖譜設(shè)計(jì)一臂之力:輔助Schema半自動(dòng)化設(shè)計(jì)
大模型在部分領(lǐng)域上擁有領(lǐng)域常識(shí)知識(shí),可以輔助完成Schema的半自動(dòng)化設(shè)計(jì),AIGC為知識(shí)推理保駕護(hù)航:輔助知識(shí)圖譜(KG)表示學(xué)習(xí)與知識(shí)圖譜(KG)補(bǔ)全,AIGC為知識(shí)融合掃清障礙:輔助Scheme融合與實(shí)體對(duì)齊。
(以上圖文來(lái)自網(wǎng)絡(luò))
05利用大模型的泛化能力和海量知識(shí),可以輔助完成多模態(tài)知識(shí)圖譜融合
在知識(shí)推理方面,AIGC技術(shù)可以輔助KG表示學(xué)習(xí)和KG補(bǔ)全?;诖竽P偷膹?qiáng)大自然語(yǔ)言處理能力和海量知識(shí)的支持,AIGC技術(shù)可以從各個(gè)文檔、圖像和視頻中快速抽取有用信息,并自動(dòng)填充到知識(shí)圖譜中,從而提高知識(shí)圖譜的完備性和準(zhǔn)確性,并支持更加深層次的知識(shí)推理。
(以上圖文引用來(lái)自http://arxiv.org/abs/2206.14268和http://arxiv.org/abs/2212.05767)
其次,在知識(shí)融合方面,AIGC技術(shù)也可以幫助我們進(jìn)行Scheme融合和實(shí)體對(duì)齊。通過(guò)大模型的泛化能力和領(lǐng)域常識(shí)知識(shí),AIGC技術(shù)可以自動(dòng)進(jìn)行Schema匹配和實(shí)體對(duì)齊,并解決知識(shí)圖譜中的冗余、不一致等問(wèn)題,從而實(shí)現(xiàn)知識(shí)融合的自動(dòng)化和高效化。
最后,利用大模型的泛化能力和海量知識(shí),我們還可以輔助完成多模態(tài)知識(shí)圖譜的融合。在這一過(guò)程中,AIGC技術(shù)可以利用多種數(shù)據(jù)源和多種表達(dá)形式,如文本、圖像和聲音等,來(lái)構(gòu)建更加全面和豐富的多模態(tài)知識(shí)圖譜,并支持多模態(tài)知識(shí)的推理和應(yīng)用。 除了上述提到的應(yīng)用場(chǎng)景,AIGC技術(shù)還可以在其他領(lǐng)域中發(fā)揮重要作用。例如,在醫(yī)療、金融和物聯(lián)網(wǎng)等領(lǐng)域,AIGC技術(shù)可以幫助企業(yè)和機(jī)構(gòu)更好地了解和管理自己的業(yè)務(wù)和流程,從而提高生產(chǎn)效率和服務(wù)質(zhì)量。 在醫(yī)療領(lǐng)域,AIGC技術(shù)可以協(xié)助醫(yī)生進(jìn)行病例診斷和治療方案設(shè)計(jì)。通過(guò)分析大量的臨床數(shù)據(jù)和病例信息,AIGC技術(shù)可以自動(dòng)生成病例分類、藥品推薦、治療方案等智能化輸出,從而幫助醫(yī)生更加準(zhǔn)確地診斷疾病和制定治療計(jì)劃,并提高治療效果。 在金融領(lǐng)域,AIGC技術(shù)可以輔助企業(yè)進(jìn)行風(fēng)險(xiǎn)評(píng)估和投資決策。通過(guò)分析市場(chǎng)數(shù)據(jù)、企業(yè)財(cái)報(bào)和行業(yè)趨勢(shì)等信息,AIGC技術(shù)可以提供智能化的投資建議和風(fēng)險(xiǎn)預(yù)警,從而幫助企業(yè)和投資者做出更加準(zhǔn)確的投資決策,并降低投資風(fēng)險(xiǎn)。 在物聯(lián)網(wǎng)領(lǐng)域,AIGC技術(shù)可以幫助企業(yè)更好地管理和監(jiān)測(cè)設(shè)備狀態(tài)和數(shù)據(jù)流。通過(guò)連接各種傳感器和智能設(shè)備,AIGC技術(shù)可以實(shí)現(xiàn)數(shù)據(jù)采集、處理和分析,并通過(guò)自動(dòng)化控制和預(yù)測(cè)性維護(hù)等手段,提高設(shè)備利用率和效率,降低生產(chǎn)成本和機(jī)器故障率。
總之,AIGC技術(shù)的應(yīng)用使得知識(shí)推理和融合變得更加高效、精準(zhǔn)和自動(dòng)化,從而大大提高了多模態(tài)知識(shí)圖譜(MMKG)的實(shí)用性和應(yīng)用價(jià)值。通過(guò)生成式AI技術(shù),也可以自動(dòng)化地從大量的數(shù)據(jù)中提取和整合多模態(tài)知識(shí)圖譜(MMKG)信息,形成結(jié)構(gòu)化的知識(shí)表示,提高多模態(tài)知識(shí)圖譜(MMKG)的構(gòu)建效率,豐富多模態(tài)知識(shí)圖譜(MMKG)的內(nèi)容,進(jìn)一步推動(dòng)知識(shí)表示和處理領(lǐng)域的發(fā)展。未來(lái),我們可以進(jìn)一步探索多模態(tài)知識(shí)圖譜(MMKG)和拓展AIGC技術(shù)的應(yīng)用場(chǎng)景,開(kāi)發(fā)更加豐富和智能的知識(shí)服務(wù)和應(yīng)用,為人類知識(shí)創(chuàng)造和創(chuàng)新提供更加強(qiáng)有力的支持。
參考:
部分內(nèi)容參考來(lái)自復(fù)旦大學(xué)教授李直旭《AIGC時(shí)代的多模態(tài)知識(shí)工程思考與展望》
論文:《Google’s PaLM-E is a generalist robot brain that takes commands》
《X. Zhu, Z. Li et. al. Multi-Modal Knowledge Graph Construction and Application: A Survey, Accepted by TKDE in Dec. 2022
http://arxiv.org/abs/2206.14268和http://arxiv.org/abs/2212.05767
點(diǎn)擊關(guān)注,第一時(shí)間了解華為云新鮮技術(shù)~
標(biāo)簽: