信息抽取是指從多源異構(gòu)的數(shù)據(jù)源中提取出實體、屬性以及實體之間的關(guān)系,在此基礎(chǔ)上形成本體化的知識表達,它是知識圖譜構(gòu)建技術(shù)的關(guān)鍵[1]。早期信息抽取主要是基于預(yù)定規(guī)則的抽取技術(shù),工作量龐大且*適用于特定的專業(yè)領(lǐng)域,后來人們開始嘗試使用統(tǒng)計機器學(xué)習的方法,通過標注部分數(shù)據(jù)得到訓(xùn)練集,在此基礎(chǔ)上再使用均方根誤差算法(rootmeansquarederror,RMSE)或多項式回歸算法(polyno?mialregression,PR)等有監(jiān)督學(xué)習算法識別命名實體。將傳統(tǒng)統(tǒng)計質(zhì)量控制中的事后檢驗轉(zhuǎn)變?yōu)槭孪?預(yù)測,重點是揭示隱藏在其中的有價值的模式和知識。信息化智慧導(dǎo)讀前景
數(shù)字化圖書館是圖書館發(fā)展的大趨勢,數(shù)字化圖書館不僅適應(yīng)了現(xiàn)代化發(fā)展方向,在現(xiàn)實生活中,由于數(shù)字化圖書館包含了海量數(shù)據(jù)信息,其服務(wù)功能也越來越強大。隨著網(wǎng)絡(luò)的發(fā)展,數(shù)字化圖書館既是傳統(tǒng)圖書館優(yōu)勢的繼承和創(chuàng)新載體,又結(jié)合了網(wǎng)絡(luò)的便利性,與現(xiàn)代人的閱讀需要更為相符。研究中發(fā)現(xiàn)圖書館雖然在加速數(shù)字化圖書館的基礎(chǔ)設(shè)施建設(shè)方面做了很多工作,但還是存在著一些問題,如經(jīng)費投入、管理維護、資源建設(shè)和創(chuàng)新發(fā)展等方面。除了要解決這些問題,還要注意加大技術(shù)融合力度、加大經(jīng)費投入力度、加大對專業(yè)人才的培養(yǎng)。所以,要抓好數(shù)字化圖書館的技術(shù)創(chuàng)新和管理,創(chuàng)新管理方法和運行機制,提升用戶的整體滿意度。并且要整合好各種數(shù)字化圖書館資源,除了電子資源還要利用好紙質(zhì)資源,擴展圖書館的綜合閱讀面,加大圖書館數(shù)字化技術(shù)的覆蓋面和受眾范圍的廣度,促進數(shù)字化圖書館更好地發(fā)展。智慧導(dǎo)讀哪家好從數(shù)據(jù)資源、數(shù)據(jù)分 析技術(shù)、數(shù)據(jù)價值性等角度闡述基于大數(shù)據(jù)構(gòu)建知識務(wù)引擎體系。
用戶參與行為的具體分析可從三方面進行:***,行為構(gòu)成。數(shù) 字閱讀類應(yīng)用主要的參與行為除了瀏覽、互動和創(chuàng)造行為,還包括 標記、批注和收藏等閱讀過程中會發(fā)生的行為。另外,不同數(shù)字閱 讀類應(yīng)用其用戶參與行為偏好有所側(cè)重。例如, 在具備聲覺空間型 和經(jīng)典抽象性媒介特性的喜馬拉雅聽書應(yīng)用上,用戶偏重閱聽,從 而其中的參與行為會有所不同。根 據(jù)感官類 型和內(nèi)容 特 性的媒介 劃分可以明確用戶參與行為的一般構(gòu)成,以及在某一媒介類型的參 與行為側(cè)重, 然后根據(jù)用戶研究方法進行定性分析,總結(jié)參與行為 構(gòu)成的一般規(guī)律。第二,行為類型。用戶參與行為分 成圍觀式參與、話語式參與和行動式參與三種參與類型,對數(shù)字閱 讀類應(yīng)用的使用過程中用戶所產(chǎn)生的參與行為包括瀏覽、搜尋、標 注、評論、收藏、分享等,根據(jù)參與程度將參與行為類型進行分類, 建立參與行為構(gòu)成的影響要素與參與程度、閱讀體驗之間的內(nèi)在關(guān) 聯(lián)。
數(shù)字閱讀過程具有參與傾向:用戶參與賦予數(shù)字閱讀類應(yīng)用巨大價值??萍嫉母咚侔l(fā)展與媒介的迭代創(chuàng)新使得用戶習慣于從判斷、計劃到實施的各個階段通通依賴于信息網(wǎng)絡(luò)執(zhí)行具體某類行為,而用戶體驗的友好程度對用戶決策產(chǎn)生影響所占的比重越來越大,因此,在互聯(lián)網(wǎng)行業(yè)中通過研究用戶行為,進而改良信息系統(tǒng)體驗流程的設(shè)計方法受到***關(guān)注。另外,數(shù)字閱讀行為基本承襲了紙本閱讀,例如,在閱讀過程中用戶會產(chǎn)生批注、標記、畫線、摘抄、評論、分享等行為,數(shù)字閱讀活動中用戶參與的行為傾向被進一步放大,用戶在閱讀體驗中的深度參與為數(shù)字閱讀類應(yīng)用創(chuàng)造了巨大價值。網(wǎng)絡(luò)化的發(fā)展使圖書館在文獻服務(wù)形式上更加多元,包括音視頻、圖文等,可以滿足各類讀者的檢索服務(wù)需求。
網(wǎng)格技術(shù)在數(shù)字圖書館建設(shè)中的應(yīng)用主要體現(xiàn)在以下幾個方面。***,網(wǎng)格技術(shù)為數(shù)字圖書館提供了技術(shù)平臺支持。在數(shù)字圖書館中,依靠網(wǎng)格技術(shù)能夠?qū)崿F(xiàn)用戶的資源請求與館藏可用資源的有效匹配,同時對于多個請求的資源需求也可以依靠網(wǎng)格技術(shù)進行統(tǒng)籌安排,實現(xiàn)資源的優(yōu)化調(diào)度[7-12]。第二,網(wǎng)格技術(shù)具有較強的海量數(shù)據(jù)處理功能?,F(xiàn)代數(shù)字圖書館擁有海量的數(shù)據(jù)信息,必須依靠相應(yīng)的技術(shù)對數(shù)據(jù)進行處理,從而轉(zhuǎn)化為用戶需要的結(jié)果。在實際的檢索中,用戶只需用客戶端發(fā)出要求指令,網(wǎng)格便會合理分配信息,**終的執(zhí)行結(jié)果會很快反饋給用戶,從而**縮短了用戶的數(shù)據(jù)查詢和檢索時間,實現(xiàn)了高效檢索。第三,有利于資源共享。數(shù)字圖書館擁有豐富的信息資源,依靠網(wǎng)格技術(shù)的共享硬件、共享存儲、共享計算以及面向用戶的特點,可以充分實現(xiàn)文獻資源的***共享。上海半坡數(shù)字圖使館可以轉(zhuǎn)儲讀者所閱讀的文獻知識全文,為圖書館介入知識發(fā)現(xiàn)與服務(wù)奠定文獻儲備的基礎(chǔ)。互聯(lián)網(wǎng)智慧導(dǎo)讀標志
大數(shù)據(jù)環(huán)境下圖書館應(yīng)該把讀者的閱讀行為、身份特征、個人愛好與習慣和社會關(guān) 系等隱私數(shù)據(jù)。信息化智慧導(dǎo)讀前景
數(shù)字圖書館不同于傳統(tǒng)意義上的實體圖書館,它是利用數(shù)字處理技術(shù)的圖書館,其實質(zhì)是集計算機技術(shù)、通信技術(shù)、微電子技術(shù)于一體的現(xiàn)代信息服務(wù)系統(tǒng)。從數(shù)字圖書館的內(nèi)涵可以看出,數(shù)字圖書館包括以下幾個特征。***,館藏資源的數(shù)字化。在數(shù)字圖書館建設(shè)過程中,所有的館藏資源都需要提前進行數(shù)字化處理,從而形成具有一定規(guī)模且內(nèi)容和主題相對**的數(shù)字資源。第二,操作計算機化。數(shù)字圖書館建設(shè),是實現(xiàn)對各類文獻信息資源的收集、加工、存儲、檢索、管理和傳輸,因而整個過程始終離不開計算機操作。第三,信息傳輸?shù)木W(wǎng)絡(luò)化。讀者獲取的文獻信息都是通過網(wǎng)絡(luò)進行傳輸?shù)?。第四,存取自由化。讀者可以隨時通過網(wǎng)絡(luò)查詢數(shù)字圖書館的文獻資源,打破了時空的限制。第五,資源共享和結(jié)構(gòu)連接化。隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,數(shù)字圖書館基本上實現(xiàn)了資源共享,用戶在任何一個數(shù)字圖書館都可以享受“聯(lián)機檢索”服務(wù)。也正因為計算機技術(shù)的不斷發(fā)展和應(yīng)用,數(shù)字圖書館的建設(shè)才有了相關(guān)技術(shù)保障。例如,數(shù)據(jù)挖掘技術(shù)、網(wǎng)格技術(shù)、智能Agent技術(shù)等技術(shù),已廣泛應(yīng)用在現(xiàn)代數(shù)字圖書館建設(shè)中,并發(fā)揮了良好的推動作用。信息化智慧導(dǎo)讀前景