![]()
麥肯錫公司最新報告顯示,生成式人工智能有望每年為全球經濟貢獻高達4.4萬億美元。對于開發者和IT領導者而言,這無疑是一個千載難逢的機遇。
然而,當前超過半數的員工在使用AI技術時并未獲得雇主的正式許可,他們迫切希望借助這些工具提升工作效率。值得注意的是,有32%的員工計劃在不久的將來將生成式AI集成到自己的工作流程中,無論公司是否出臺相關政策。這種現象凸顯了員工對AI技術的熱情以及組織可能面臨的風險。
要充分發揮生成式AI的潛力,公司首先需要重視數據管理和準備工作。數據是驅動生成式AI理解和分析世界的關鍵,也是其實現變革性突破的基石。因此,建立健全的數據管理體系和策略至關重要。
此外,公司還需為大規模AI服務的構建和運營奠定基礎,并確保生成式AI項目獲得持續且明智的資金支持。在這場激烈的人工智能競爭中,遲緩的步伐可能導致失敗。因此,公司必須在數據層面做好充分準備,同時有策略地擴大AI服務規模,并確保資金來源穩定可靠。
然而,如果我們忽視了數據管理的重要性或未能有效應對規模擴大和成本控制的挑戰,那么生成式AI的巨大潛力可能會付諸東流。為了避免這種情況發生,數字經濟應用實踐專家駱仁童博士指出,我們需要積極探索改進數據管理方法的途徑,并思考如何為長期支持生成式AI項目提供有力保障。只有這樣,我們才能確保生成式AI在推動全球經濟增長方面發揮出應有的作用。
![]()
AI的數據來源
AI的數據以多樣的形態呈現,每種形態的數據都能在適當應用下豐富生成式AI的洞察力和質量。其中,結構化數據以其規則有序的組織方式脫穎而出,涵蓋了產品詳情、客戶統計數據以及庫存水平等各類信息。這種數據為生成式AI注入了堅實的事實基礎,有助于提升響應的精準度。
除此之外,外部數據源也為內部結構化數據提供了有力的補充。天氣預報、股市動態、交通流量等實時信息,為決策過程增添了真實世界的色彩。將這些數據融入生成式AI項目中,不僅能提供高質量的數據支持,還能避免自行生成這類數據所需的繁瑣流程。
衍生數據則是另一種重要的數據形態。它通過對原始數據進行深入分析和建模得出,涵蓋了客戶意圖、銷售預測以及群體行為等方面的洞見。這些數據為生成式AI提供了更深層次的理解,有助于挖掘更具價值的信息。
然而,非結構化數據也不容忽視。與傳統的報告或數據格式不同,非結構化數據包括圖像、文檔和音頻文件等多種形式。它們捕捉到了人類溝通和表達的微妙之處,為生成式AI提供了獨特的視角。生成式AI程序常常以此類數據為基礎進行工作,將其作為輸入和輸出的常見選擇。
但值得注意的是,數據隱私和網絡安全問題在使用生成式AI時尤為突出。65%的公司表示,這是他們在使用生成式AI工具時面臨的首要挑戰。這些工具在收集和處理數據時,可能涉及到IP地址、瀏覽活動等敏感信息,存在被識別個人身份的風險。一旦數據處理不當或發生泄露,可能會造成嚴重的后果。
此外,深度偽造技術的興起也加劇了人們的擔憂。它能夠在未經許可的情況下創建逼真的圖像和聲音,對社會穩定和個人權益構成威脅。同時,AI工具也使得犯罪分子能夠制造更復雜的釣魚郵件和惡意軟件,加速網絡攻擊的進程。
因此,在使用生成式AI時,數字經濟應用實踐專家駱仁童博士強調,企業必須高度重視數據隱私和網絡安全問題。定期評估網絡安全策略,確保其與人工智能的發展保持同步至關重要。同時,采取強大的數據隱私措施如數據匿名化和加密等也是必不可少的。只有這樣,我們才能充分發揮生成式AI的潛力,同時保障個人和社會的利益不受損害。
![]()
靈活型的大數據
在這個多元化的時代,各種各樣的數據集散落在不同的環境中。為了讓它們在生成式AI項目中發揮作用,關鍵是要構建一個實時的、多樣化的數據景觀,使其能夠被輕松訪問。此外,還需要對數據進行預處理,以便生成式AI系統能夠有效地利用它們。嵌入使得生成式AI系統能夠理解并使用數據,同時保留其意義和上下文。無論原始數據的形式如何,通過創建嵌入,我們都能讓生成式AI系統超越簡單的文本匹配,深入挖掘數據背后的意義和上下文。
通過這些嵌入,企業可以在所有數據上進行向量搜索或混合搜索,同時結合數據的價值和意義。然后,將這些結果匯總后傳遞給大規模語言模型(LLM)進行整合。通過從多個來源提供更多數據,而不僅僅依賴LLM本身,你的生成式AI項目就能為用戶提供更準確、更可靠的結果,并大大降低虛構內容的風險。
要實現這一目標,必須選擇合適的底層數據架構。在這個過程中,我們應盡量避免將數據分散在不同的解決方案中,形成碎片化的拼湊,因為每個這樣的解決方案都可能成為一個需要長期維護、查詢和管理的數據孤島。相反,我們應尋求一種統一的數據架構,它能夠無縫地集成數據,使生成式AI能夠充分利用所有可用的數據頻譜。這樣,用戶就能快速地向LLM提問并迅速得到回應,而不必等待多個組件逐一響應并由模型權衡其結果。這將極大地提高生成式AI的效率和準確性,為用戶帶來更好的體驗。
![]()
AI模塊化應用的優勢
為了擴展生成式AI實施,需要在加快采用速度與保持對關鍵資產的控制之間取得平衡。采用模塊化的方式來構建生成式AI代理可以使這個過程變得更容易,因為它可以分解實施過程,避免潛在的瓶頸。
類似于微服務設計在應用程序中的應用,AI服務的模塊化方法也鼓勵圍繞應用程序和軟件設計的最佳實踐,消除故障點,并讓更多潛在用戶能夠接觸這項技術。這種方法還使得監控整個企業中AI代理的表現變得更容易,能夠更精確地找出問題發生的位置。
模塊化的第一個好處是可解釋性,因為參與生成式AI系統的各組成部分彼此分離,這樣就更容易分析代理是如何運作和作出決策的。AI通常被視為“黑箱”,而模塊化使得跟蹤和解釋結果變得更加容易。第二個好處是安全性,因為各個組件可以通過最佳認證和授權機制進行保護,確保只有授權用戶才能訪問敏感數據和功能。模塊化還使得合規和治理變得更容易。
類似的做法是將生成式AI視為企業自身運營的產品,而非單純的軟件。AI代理應作為產品來管理,因為這更能有效地體現其所創造的價值,并使整合、工具和提示方面的支持資源更容易獲得。簡化這種模式有助于在整個組織內普及對生成式AI的理解,促進最佳實踐的采納,并營造出共享專業知識和協作的生成式AI開發文化。
生成式AI具有巨大的潛力,各公司正競相在其運營中實施新的工具、代理和提示。然而,要將這些潛在項目投入生產,就需要有效管理數據、奠定系統規模化發展的基礎,并建立合適的預算模型以支持團隊。合理安排流程和優先級將有助于你和你的團隊釋放這項技術的變革潛力。
![]()
關注ai帶來的新挑戰
最后,面對生成式AI工具,我們必須保持警惕。盡管這些工具在缺乏足夠信息時仍會給出回應,但它們有時會編造答案,這要求我們在接收信息時不能只看表面,而要積極核實其有效性。事實上,60%的公司將此視為生成式AI的最大擔憂,因為這可能引發聲譽問題和其他嚴重后果。因此,AI算法的開發者應設定編造答案的比例或是否允許無答案的情況發生。同時,了解所使用工具的開發背景至關重要,以便確定組織可接受的誤差范圍。通常,將誤差范圍設為零是最佳選擇,因為沒有信息總比錯誤信息強。
版權和知識產權(IP)風險也是與生成式AI相關的重要問題。這些模型可能在受法律保護的材料上訓練,并生成類似現有作品的內容。若用戶未給予適當的信用,可能導致版權、商標或專利侵權。目前,法院正努力解決如何將知識產權法應用于AI生成的內容,但這需要一定時間。
因此,保護知識產權和培訓員工批判性地思考他們輸入AI工具的信息至關重要。明確規定哪些員工和合作伙伴可以訪問公司的知識產權和敏感信息,并禁止特定材料和數據被輸入AI模型。同時,教育員工如何合法地使用AI生成的內容以避免侵犯版權也是必不可少的。
隨著生成式AI技術的不斷發展,我們應保持關注并隨時了解相關法律進展。雖然生成式AI帶來了諸多挑戰,但它也為我們帶來了前所未有的效率和機會。AI技術預計每年將為全球經濟增加4.4萬億美元的價值。為了充分利用這些益處,公司需要深入了解并有效管理AI的風險。從現在開始,讓我們共同保護和推動業務的發展。
商道童言(Innovationcases)歡迎點贊和分享哦!~~
免費電子書: | | | |
數字經濟應用實踐專家 駱仁童主講課程
人工智能:
數字應用:
數字中國:
數字化轉型:》
產業數字化:《》
宏觀與趨勢:
思維與技能:》
創新與創業:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.