拓爾思(300229)6月14日發(fā)布投資者關(guān)系活動記錄表,公司于2023年6月13日接受13家機(jī)構(gòu)調(diào)研,機(jī)構(gòu)類型為保險(xiǎn)公司、其他、基金公司、海外機(jī)構(gòu)、證券公司、陽光私募機(jī)構(gòu)。 投資者關(guān)系活動主要內(nèi)容介紹: 一、公司副總經(jīng)理、董事會秘書李黨生先生就公司業(yè)務(wù)發(fā)展情況、近期經(jīng)營情況及未來戰(zhàn)略規(guī)劃進(jìn)行介紹。 二、參會機(jī)構(gòu)提問及回答
(資料圖片僅供參考)
問:請問公司專業(yè)大模型研發(fā)進(jìn)度如何?預(yù)計(jì)何時(shí)發(fā)布?
答:公司拓天專業(yè)大模型正在研發(fā)測試過程中,預(yù)計(jì)于2023年6月底前推出,具體時(shí)間請留意公司發(fā)布的相關(guān)信息。
問:公司認(rèn)為大模型在場景落地中存在哪些挑戰(zhàn)?
答:大模型技術(shù)在場景落地中的挑戰(zhàn),主要集中在質(zhì)量、可控、時(shí)效和成本四個(gè)層面。在質(zhì)量層面,個(gè)人用戶對事實(shí)類問答錯(cuò)誤反饋的容忍度要高于企業(yè)用戶,在為企業(yè)用戶提供服務(wù)時(shí),數(shù)據(jù)來源必須是準(zhǔn)確的,不能發(fā)生“張冠李戴”“編造情節(jié)”“正確的廢話”和災(zāi)難遺忘等問題。在可控層面,其一是內(nèi)容安全,數(shù)據(jù)是有價(jià)值觀的,而大模型沒有,要重視訓(xùn)練文本的合規(guī)問題;其二是關(guān)注企業(yè)自身數(shù)據(jù)安全和用戶隱私保護(hù)。在時(shí)效層面,災(zāi)難性的遺忘一直都是大數(shù)據(jù)訓(xùn)練的問題,即時(shí)數(shù)據(jù)的補(bǔ)充也是一項(xiàng)挑戰(zhàn)。在成本層面,千億模型私有化落地的時(shí)候需要訓(xùn)練好,在企業(yè)端落地還需要讓企業(yè)用得起。并且,大模型對算力要求高,訓(xùn)練成本居高不下。
問:公司擁有的網(wǎng)絡(luò)公開數(shù)據(jù)具有那些特點(diǎn)?規(guī)模有多大?
答:公司自2010年自建大數(shù)據(jù)中心,以長期服務(wù)多行業(yè)用戶持續(xù)積累的開源數(shù)據(jù)為基礎(chǔ),擁有了規(guī)模及質(zhì)量均位列業(yè)界前茅的公開信源數(shù)據(jù),目前數(shù)據(jù)總量超1500億條,并保持日均億級數(shù)據(jù)的采集增長。公司擁有的網(wǎng)絡(luò)公開數(shù)據(jù)具備信源權(quán)威可靠、內(nèi)容價(jià)值觀對齊、豐富的專業(yè)領(lǐng)域知識、千億級數(shù)據(jù)規(guī)模、數(shù)據(jù)渠道和類型多樣性以及數(shù)據(jù)實(shí)時(shí)性(分鐘級更新)六大特點(diǎn)。所有公開采集的數(shù)據(jù)經(jīng)過加工處理后,將推送到公司三大數(shù)據(jù)資產(chǎn)平臺(媒體資訊、輿情、產(chǎn)業(yè)大腦),通過不同專業(yè)模型轉(zhuǎn)化成不同領(lǐng)域的知識數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)從資源性到經(jīng)營性的數(shù)據(jù)資產(chǎn)變現(xiàn)。
問:公司專業(yè)大模型訓(xùn)練具體分為哪些步驟?
答:公司拓天專業(yè)大模型訓(xùn)練主要分為擴(kuò)充數(shù)據(jù)基座、增量預(yù)訓(xùn)練、指令微調(diào)、插件增強(qiáng)和測評五大步驟。
問:公司專業(yè)大模型在出版?zhèn)髅筋I(lǐng)域前景如何?
答:在傳媒出版領(lǐng)域,拓爾思長期服務(wù)人民出版社、人民教育出版社、知識產(chǎn)權(quán)出版社等23家出版單位,主要為傳媒出版用戶提供大數(shù)據(jù)資源管理、知識圖譜等技術(shù)服務(wù)。各家出版單位積累了各自細(xì)分賽道的優(yōu)質(zhì)稀缺數(shù)據(jù)資源,但同時(shí)大多數(shù)出版單位不具備自己訓(xùn)練垂類大模型的技術(shù)和資源,并且對將信息數(shù)據(jù)交由第三方MaaS服務(wù)商訓(xùn)練而產(chǎn)生的數(shù)據(jù)泄露問題存在顧慮,擔(dān)心削弱其核心內(nèi)容價(jià)值。公司在此過程中,可以成為出版業(yè)理想的合作伙伴,一是公司與上述出版單位已建立起長期友好的伙伴關(guān)系,具備信任基礎(chǔ);二是公司承建的大數(shù)據(jù)資源管理、知識圖譜等平臺正是出版業(yè)運(yùn)行優(yōu)質(zhì)稀缺數(shù)據(jù)資產(chǎn)的主要系統(tǒng),公司熟悉出版業(yè)IT環(huán)境與數(shù)據(jù)特點(diǎn);三是公司自主研發(fā)的拓天專業(yè)大模型,支持私有化部署和信創(chuàng),并對其進(jìn)行了中文特性加強(qiáng)、內(nèi)容安全、價(jià)值觀對齊等訓(xùn)練;四是公司擁有的媒體資訊數(shù)據(jù)、產(chǎn)業(yè)數(shù)據(jù)、政策數(shù)據(jù)、風(fēng)控?cái)?shù)據(jù)等全域另類數(shù)據(jù)與出版業(yè)擁有的各自內(nèi)容細(xì)分獨(dú)特領(lǐng)域數(shù)據(jù),可以按專業(yè)維度進(jìn)行融合訓(xùn)練,打造出不同專業(yè)領(lǐng)域的知識助手;五是雙方共同打造的垂類知識助手,以合作分成的方式進(jìn)行聯(lián)合共創(chuàng)運(yùn)營,可面向不同行業(yè)的從業(yè)人員、高校師生、研究機(jī)構(gòu)、產(chǎn)業(yè)鏈企業(yè)等提供專業(yè)的付費(fèi)知識服務(wù)。目前,公司正在和多家合作出版用戶積極推進(jìn)聯(lián)合共創(chuàng)垂類知識大模型的事宜。
問:拓天大模型有哪些應(yīng)用場景?
答:在不同大模型數(shù)據(jù)和功能的基礎(chǔ)上,公司自研拓天大模型通過提供對應(yīng)的提示工程接口和模型精調(diào)接口等生成政務(wù)大模型、金融大模型和媒體大模型,應(yīng)用場景包括政務(wù)應(yīng)用、金融應(yīng)用和媒體應(yīng)用。政務(wù)應(yīng)用涵蓋公文輔助寫作、政策解讀等;金融應(yīng)用涵蓋投研報(bào)告自動生成、投研知識問答等;媒體應(yīng)用涵蓋新聞資訊知識型搜索、以文生圖配稿等。
問:請問公司有沒有算力租賃相關(guān)業(yè)務(wù)?同英偉達(dá)有合作嗎?
答:目前,公司不涉及算力租賃相關(guān)業(yè)務(wù)。公司未來將進(jìn)一步與行業(yè)合作伙伴、區(qū)域合作伙伴、服務(wù)合作伙伴、運(yùn)營商以及行業(yè)知識專家、行業(yè)頭部企業(yè)展開市場、渠道、算力、智力、創(chuàng)新樣本等全方位的合作。公司同英偉達(dá)暫未開展直接商業(yè)合作;
調(diào)研參與機(jī)構(gòu)詳情如下:
| 參與單位名稱 | 參與單位類別 | 參與人員姓名 |
|---|---|---|
| 中信建投基金 | 基金公司 | 趙堅(jiān) |
| 中加基金 | 基金公司 | 黃曉磊 |
| 平安基金 | 基金公司 | 張淼 |
| 泰達(dá)宏利基金 | 基金公司 | 蘭飛、徐雨楠 |
| 中金公司 | 證券公司 | 童思藝 |
| 華安證券 | 證券公司 | 傅曉烺、王奇鈺 |
| 平安證券 | 證券公司 | 付強(qiáng)、王佳一 |
| 開源證券 | 證券公司 | 劉逍遙 |
| 鴻道投資 | 陽光私募機(jī)構(gòu) | 於彩 |
| 國壽養(yǎng)老 | 保險(xiǎn)公司 | 徐寶龍、馬志強(qiáng) |
| 美林證券 | 海外機(jī)構(gòu) | 莊亞林、李慧群 |
| CBC寬帶資本 | 其他 | 陳曼榕 |
| 匯泉基金 | 其他 | 陳蘇 |
關(guān)鍵詞:
版權(quán)與免責(zé)聲明:
1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
2 在本網(wǎng)的新聞頁面或BBS上進(jìn)行跟帖或發(fā)表言論者,文責(zé)自負(fù)。
3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實(shí),不對您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
4 如涉及作品內(nèi)容、版權(quán)等其它問題,請?jiān)?0日內(nèi)同本網(wǎng)聯(lián)系。