國外數字圖書館推薦系統評述

作者:時間:2011-02-12 11:06:52  來源:www.6scc.cn  閱讀次數:1319次 ]

摘 要:本文通過介紹Tapestry, Fab, Citeseer, SERF, Melvy,l Amazon等幾種常見的推薦系統,概 述了國外數字圖書館推薦系統的研究進展,分析其主要特點,指出對國內數字圖書館建設具有借鑒意義.
    關鍵詞:數字圖書館;推薦系統;研究進展 

Abstract:By introducing several common recommendation systems such as Tapestry, Fab, Citeseer, SERF, Melvyl and Amazon, this article summarizes the overseas research progress on digital library recommendation sys- tems, analyzes theirmajor characteristics, and points out their reference significance to digital library construction at home· 
Keywords:digital library; recommendation system; research progress  心理學論文發表

      數字圖書館推薦系統是通過向用戶提供有關的文獻信 息或利用的建議,幫助用戶找到和選擇比較相關信息的一 種工具。它能夠收集和統計用戶查找信息,通過分析用戶 行為的特點來對信息內容進行推薦。近年來,國外對數字 圖書館推薦系統的研究取得一定的進展,本文將對國外常 見的幾種數字圖書館推薦系統加以介紹和評價.
    1 Tapestry系統 1992年12月,美國施樂公司研究所開發了Tapestry 系統,這是早期的推薦系統,目的是過濾海量的電子郵 件,推薦電子新聞[1]。在Tapestry系統中,用戶可以對閱 讀過的文章發表意見,標注出他們是“喜歡”或“討厭” 這篇文章。其他用戶既可以根據關鍵詞檢索文章,也可以 根據用戶的評注來選擇文章閱讀。Tapestry系統以促進用 戶之間相互了解為前提,從而讓用戶清楚哪些評注具有參 考價值;它不是自動根據用戶興趣進行推薦,而需通過用 戶構造較復雜的查詢才能得到檢索結果。其體系結構如圖 1所示。開發者Goldberg等人還首次提出“協同過濾”的 概念:即人們相互協作,通過記錄其對閱讀過的文檔的反 應態度(有興趣或不感興趣)進行篩選,這對以后的推 薦系統研究與開發具有重要的啟發意義.
    2 斯坦福大學的Fab系統 Fab系統是斯坦福大學數字圖書館項目研究的一部分 內容。1997年3月, M·Balabanovic詳細介紹了Fab系統 的結構與功能[2]。Fab旨在幫助用戶從海量的互聯網信息 中篩選出有用信息。該系統結合了基于內容的推薦和協同 推薦的優點,采用混合推薦技術向用戶推薦感興趣的信 息。其推薦過程可分為兩步:第一,收集信息建立可管理 的數據庫;第二,為特定用戶從數據庫中選擇所需要的信 息。Fab主要由3個部分組成:收集代理(即查找特定主 題的網頁)、選擇代理(即為特定用戶查找網頁)和中央 路由器。每個代理都根據有用戶評價的網頁所包含的詞語 構成一個文檔(Profile)。收集代理的文檔代表目前的主 題,而選擇代理的文檔代表單個用戶的興趣。收集代理將 收集到的網頁提交給中央路由器,再由中央路由器根據頁 面與用戶文檔的匹配程度向用戶推薦頁面;用戶的選擇代 理還可以刪除用戶已經看過的頁面,并在任何單批的推薦 (通常為10頁)確保每個站點最多推薦一個頁面。用戶的 反饋往往投入了大量的時間和精力,應將其存儲在各自的 選擇代理文檔中,并確保不被其他用戶反饋所“淹沒”.
    用戶需要對推薦的頁面予以評級,據此更新其個人選擇代 理的文檔以及調整原始收集代理的文檔。同時,用戶評價 較高的頁面直接推薦給具有相近興趣的用戶,實現協同推 薦。而打分特別高的網頁將會直接推薦給用戶的最近鄰 居,即和用戶具有相似偏好的其他用戶。Fab系統的優點 是綜合了各種主要的過濾方法,能夠對一些數據量大、變 化性強的信息進行過濾,可以進行動態反饋,實現個性化 推薦服務.
    3 C iteseer系統 CiteSeer是在自動引文標引(AutonomousCitation Inde- xing, ACI)的基礎上建設的一個學術論文數字圖書館 (網址為http: //citeseer·ist·psu·edu),它提供了一種通過 引文鏈接檢索文獻的方式,目標是從多個方面促進學術文 獻信息的傳播與反饋。CiteSeer可以檢索互聯網上“Post- script”和“PDF”文件格式的學術論文。它通過網上搜 索引擎,根據給定的關鍵詞查找、下載論文,分解論文, 提取摘要、引文等特征信息,然后建成數據庫。用戶可利 用關鍵詞或鏈接到與給定文章有相同引文或引用了該文章 的論文在數據庫中尋找相關文獻。除了簡單瀏覽和關鍵詞 搜索,系統可利用文字信息和共引分析方法找到相似文 獻。CiteSeer采用自動引用標引來提高科技文獻分發或檢 索的質量,考慮了文檔間的引用關系,把引證脈絡凸顯出 來,按照文章聲望的高低向用戶發布。這些系統從大的分 類上都為信息檢索系統,但同時也包含了信息過濾及協作 過濾技術。CiteSeer預測用戶對網頁喜好程度,對網頁的 評價是通過監控用戶的書簽以及書簽目錄隱含信息而得 到。如果把一個URL保存到一個書簽目錄中,則認為用 戶喜歡該URL代表的網頁。用戶概況表通過一系列URL 來描述。使用最鄰近鄰居方法計算用戶間的相似度,把出 現在多個鄰居中的URL向目標用戶推薦[3].
    Citeseer系統主要由以下部分組成:自動定位、獲取 研究刊物的子代理;文檔解析器和數據庫生成器;支持關 鍵詞檢索和引用鏈接瀏覽的數據庫瀏覽界面。該系統的結 構見圖2。2008年7月, K·Chandrasekaran等人提出了一 種新的推薦方法,系統可以向Citeseer數據庫中的作者推 薦他們可能感興趣的研究論文[4]。首先,根據作者已發表 的論文情況,為其建立用戶文檔。然后,基于用戶文檔與 收集到的文檔內容的相似性,向作者推薦其他論文。該文 還介紹了一種表示用戶文檔的新方法:概念樹和使用樹形 修改距離度量計算用戶文檔和內容文檔之間相似性的算 法。實驗證明,基于概念的算法要比傳統的基于空間向量 模型推薦技術效果較好. 臨床醫學論文發表 
    4 基于圖表的數字圖書館推薦系統 2002年,美國Arizona大學的Z·Huang等人介紹了一 種基于圖表的數字圖書館推薦系統[5]。該系統綜合了基于 內容的推薦系統和協同推薦系統的特征,且在網上書店進 行實施。網上書店記錄了圖書的主要內容、客戶的個人背 景和購買歷史等,這些內容與數字圖書館中的文檔內容、 用戶特征、使用記錄等很相似。此方法包括兩個階段。第 一階段,使用實際客戶和圖書的特征向量來表示客戶和圖 書?蛻舻奶卣飨蛄堪ǹ蛻舻膫人背景,圖書的特征向 量主要包括圖書的特性和文本信息,如標題、簡介、前言 等。然后根據特征向量,利用相似性公

本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除! 快速論文發表網(www.6scc.cn)本中心和國內數百家期刊雜志社有良好的合作關系,可以幫客戶代發論文投稿.

投稿郵箱:ksfbw@126.com
客服Q  Q: 論文發表在線咨詢82702382
聯系電話:15295038833

本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除!

廣告推薦

文章評論

共有 0 位網友發表了評論

閱讀排行

推薦文章

最新文章

主站蜘蛛池模板: 中文字幕亚洲综合久久菠萝蜜 | 欧美综合欧美视频| 激情综合五月天| 亚洲综合色在线观看亚洲| 久久婷婷午色综合夜啪 | 久久青青色综合| 亚洲精品欧美综合在线| 小说区 图片区色 综合区| HEYZO无码综合国产精品227| 激情综合色综合久久综合| 伊人成年综合网| 色拍自拍亚洲综合图区| 亚洲综合精品网站| 一97日本道伊人久久综合影院| 激情综合色五月六月婷婷| 亚洲综合国产精品| 无码国内精品久久综合88| 色欲天天天综合网| 色欲综合久久中文字幕网| 久久婷婷五月综合色奶水99啪| 国产综合在线观看| 色妞色综合久久夜夜| 浪潮AV色综合久久天堂| 丁香五月天综合缴情网| 狠狠色丁香久久婷婷综合_中| 国产综合一区二区| 五月丁香六月综合欧美在线| 亚洲日韩在线中文字幕综合 | 国产成人麻豆亚洲综合无码精品| 99久久亚洲综合精品成人| 亚洲综合精品香蕉久久网97| 国产精品九九久久精品女同亚洲欧美日韩综合区 | 天天综合久久一二三区| 一本色道久久88精品综合| 久久国产综合精品五月天| 国产成人综合亚洲亚洲国产第一页 | 国产精品天天影视久久综合网| 狠狠久久综合伊人不卡| 成人伊人亚洲人综合网站222| 天天爽天天狠久久久综合麻豆| 综合久久一区二区三区 |