(1)用户手工定制建模
用户手工定制建模是指用户模型由用户自己手工输入或选择的用户建模方法,如用户手工输入感兴趣信息的关键词列表,或者是选择感兴趣的栏目等。用户手工定制的典型代表有My Yahoo和卡内基·梅隆大学的Web Watcher。由于Yahoo站点包含的信息繁多,而每个用户真正感兴趣的信息相当有限,为了提高用户的访问效率、使用户能够直接浏览感兴趣的信息,Yahoo站点1996年推出个性化服务My Yahoo。在用户登录站点后,系统要求用户从成百上千的栏目中手工选择自己感兴趣的栏目。用户手工定制建模方法实现简单,具有较好的效果,但依赖于用户,容易降低用户的积极性;用户很难全面、准确地罗列自己感兴趣的栏目或关键词,而且当用户兴趣发生改变时又无法及时重新输入,从而导致用户模型不够准确。
(2)示例用户建模
示例用户建模是指由用户提供与自己兴趣相关的示例及其类别属性来建立用户模型的建模方法。示例一般通过要求用户在浏览过程中对浏览过的页面标注感兴趣、不感兴趣或者感兴趣的程度来得到,因此浏览过的页面及相应标注成为用户建模的示例。其代表示例有1996年加州大学Irvine分校推出的个性化推荐智能。在用户浏览的过程中,Syskill&;Webert要求用户对每一个浏览过的页面标注“感兴趣”、“不感兴趣”、或者“一般”,而后系统通过计算页面中单字与类别的互信息找出反映用户兴趣的关键词,构成用户模型。
(3)自动用户建模
自动用户建模是指根据用户的浏览内容和浏览行为自动构建用户模型,建模过程无需用户主动提供信息的建模方法。在现有的个性化服务系统中,采用自动用户建模方法构建用户模型的系统主要有卡内基、梅隆大学的Personal Web Watcher,德国国家研究中心的ELFI,麻省理工学院的Letizia等。自动用户建模方法无需用户主动提供信息,因而不会造成对用户的干扰,有利于提高个性化服务系统的易用性,促进个性化服务的发展。实际上,用户浏览的页面就可以反映用户的兴趣主题。如果用户频繁浏览与“个性化服务”和“信息隐藏”相关的页面,则容易推测用户感兴趣的主题是“个性化服务”和“信息隐藏”。因此,如果能够对用户浏览的页面进行聚类,就能够得到用户感兴趣的主题,从而也就能够实现自动用户建模。
3.服务资源管理
服务资源管理模块是智慧公共服务的个性化信息服务系统的服务内容来源,负责对服务资源进行描述、更新。对服务资源的描述与用户模型密切相关,一般的做法是用同样的机制来表达用户模型和服务资源。目前,智慧公共服务的个性化信息服务系统所处理的资源都属于文本范畴。对文本资源的描述方法分为基于内容的方法和基于分类的方法。
(1)基于内容的方法
基于内容的方法是从资源本身抽取表示资源的信息。网页、新闻等文本领域的资源可以很容易地拆分成词的形式,因而通常采用基于内容的表示方法。其中,向量空间模型(Vector Space Model)是使用最普遍的一种方法,这种方法从文本信息中抽取特征组成特征向量,并给每个特征赋予权值。建立文本的特征向量,首先要进行特征提取;然后,对词频向量进行降维和特征选取;最后,计算每个特征的权值。
(2)基于分类的方法
基于分类的方法首先对资源进行分类,然后利用资源所属类别表示资源,对文档进行分类有利于将文档推荐给对该类文档感兴趣的用户。资源的类别可以是预先定义好的,也可以利用聚类技术自动产生。目前有许多研究表明,聚类的精度非常依赖于样本的数量,而且自动聚类产生的类型可能对于用户来说毫无意义。因此,可以先使用手工选定的类型来分类文档,在没有对应的类型或需要进一步的划分类型时,再使用聚类产生的类型。
4.服务提供
智慧公共服务的个性化信息服务提供模块,根据用户模型和服务资源描述向不同用户提供相应的服务策略和服务内容,它负责提供具体的个性化服务,如个性化推荐、个性化信息检索等。根据不同的服务形式,个性化服务提供模块的功能和实现也不相同。
根据智慧公共服务体系的特点,在智慧公共服务智慧公共服务的个性化信息服务中主要研究的服务提供方式是个性化推荐。个性化推荐是指根据用户的兴趣特点,向用户推荐其感兴趣的信息。个性化推荐的原理是根据用户模型寻找与其匹配的信息,或者寻找具有相近兴趣的用户群而后相互推荐浏览过的信息。它的实质是一种“信息找人”的服务模式,可以减少用户寻找信息的时间,提高浏览效率。
根据实现途径的不同,个性化推荐技术可以分为基于规则的推荐、基于内容的推荐、合作推荐和混合推荐。
(1)基于规则的推荐
基于规则的推荐是指根据事先生成的规则向用户推荐信息的方式。比如事先生成的适合于某用户的购买规则是“如果购买了牛奶,就会同时购买面包”,那么当用户再次浏览牛奶相关的商品时,网站可以同时向用户推荐与面包相关的信息。基于规则的推荐方式现在较多地应用于电子商务网站,根据用户浏览和购买的日志生成规则,向用户推荐感兴趣的商品。基于规则的推荐系统,如IBM的Web Sphere Broad Vision等,允许系统管理员根据用户的静态特征和动态属性来制定规则,一个规则本质上是一个If‐Then语句,规则决定了在不同的情况下如何提供不同的服务。此类系统的优点是简单、直接,缺点是规则的质量很难保证,且不能动态更新,随着规则数量的增多,系统将变得越来越难以管理。
(2)基于内容的推荐
基于内容的推荐是指通过比较资源与用户模型的相似程度向用户推荐信息的方式。该方式是目前个性化推荐的主流。由于基于内容的推荐需要进行匹配计算,因而较多地应用于可计算的文本领域,如浏览页面的推荐、新闻组中的新闻推荐等。其典型系统包括斯坦福大学的LIRA、麻省理工学院的Letizia、加州大学的Syskill&;Webert和News Dude等。基于内容的推荐的优点是简单、有效,缺点是不能为用户发现新的感兴趣的信息,只能推荐与用户已有兴趣相似的信息。
(3)合作推荐
合作推荐又被称为社会推荐,是指通过相同或相近兴趣的用户对资源的评价向用户推荐信息的方式。合作推荐实质上是现实生活中经常采用的推荐方式,如两个兴趣相近的朋友相互推荐爱听的音乐、爱看的书等。与基于内容的推荐不同,合作推荐并不比较资源与用户模型的相似性,而是通过比较用户之间的相似性来推荐信息。具有相近兴趣的用户被视为一个用户类。当用户对某信息感兴趣时,该信息就可以推荐给同类的其他用户。
合作推荐的优点是可以发现用户可能感兴趣的新信息,而不局限于用户已经感兴趣的信息,缺点是存在两个难点,一是稀疏性,即在系统使用初期由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户,也就是说如果一个信息没有被同类用户群中的任何用户浏览过,那它就不可能被推荐给该类中的其他用户;另一个是扩展性,即随着系统用户和资源的增多,系统的性能会越来越低。
(4)混合推荐
混合推荐是指既通过比较资源与各个用户模型的相似度进行基于内容的推荐,又通过相近兴趣的用户群进行合作推荐的一种推荐方式。目前提供混合推荐服务的系统还不是很多。斯坦福大学推出的基于内容的合作推荐系统FAB是其中最有影响力的系统。它根据用户对浏览页面的标注构建用户模型,并根据用户模型的相似性寻找具有相似兴趣的用户。FAB结合用户模型和邻居模型推荐用户感兴趣的页面。国内的清华大学也推出了一个混合推荐系统一一Open Bookmark,它通过集中管理用户群的Bookmark来实现混合推荐。由于可以发挥两种推荐方法的优点,抵消两种推荐方法的缺点,因而混合推荐具有更好的推荐性能。
5.用户接口
用户接口是智慧公共服务的个性化信息服务系统与用户交互的桥梁,提供用户访问智慧公共服务的个性化信息服务的入口。用户通过用户接口进行服务定制,并接受智慧公共服务的个性化信息服务系统提供的服务;智慧公共服务的个性化信息服务系统通过用户接口获取用户的个性化定制信息,服务请求以及用户对服务的反馈信息,并根据用户对个性化内容的选择改进用户建模和个性化服务提供模块的性能,提供更优质的服务。
6.信息反馈
用户是智慧公共服务的个性化信息服务的享用者,同时用户对智慧公共服务的个性化信息服务的反馈也可以用于调整智慧公共服务的个性化信息服务系统。如用户可以直接修改(显示反馈)可视化后的用户模型,以调整智慧公共服务的个性化信息服务系统的性能;系统可以根据用户对个性化内容的选择(隐式反馈)改进用户建模模块和个性化服务模块的性能。
(1)显式反馈
显式反馈主要是指系统根据用户对查询结果的感兴趣度的评价级别信息来学习用户的兴趣。该方法利用多个用户的评价级别信息合作发现某个用户潜在的兴趣。
(2)隐式反馈
隐式反馈主要是指系统根据用户的查询要求提供用户一定的检索结果,然后系统在客户端浏览器的后台时刻监视和跟踪用户的浏览行为和操作,通过一定的方法和规则去判断用户对哪些文献真正感兴趣,然后对这些文献进行内容分析,提取文献标题中的兴趣特征词和文献关键词,把它们当作是用户的兴趣特征词。
14.5智慧公共服务体系结构设计
14.5.1智慧公共服务系统的设计理念和原则
1.实施“以公众需求为中心”的战略
企业实施以客户为中心战略已经成为业界共识。传统的政府工作模式是以政府的机构和职能为中心的,企业和公众围绕政府部门转。企业和社会公众要办一件事,常常必须了解各政府部门的职能、权限、处室分工,然后一个个部门跑,反复报批。这就造成了政府部门办事难,办事效率低的现象。而智慧公共服务的本质是“以网络为工具,以公众为中心;以应用为灵魂,以便民为目的”面向公众服务的智慧公共服务工作模式,是要以公众的需求为出发点,就是政府要围着企业和公众的需求来提供服务。这样企业和社会公众就可以任何时间、任何地点、任意方式(Anytime,Anywhere,Anyhow,即3A)使用政府的网上办事服务并可查询办事的状态和结果。智慧公共服务只有实施了以公众需求为中心的战略,用户才真正体会到了政府的周到服务,才得到了最大的实惠和方便,政府部门才能彻底打破部门之间的组织界限,实现协同办公,缩短办事时间,降低行政成本,提高办公效率。
2.了解公众需求和兴趣爱好并对用户进行细分
要实现面向公众需求的智慧公共服务,首先要了解公众需求并对用户进行细分,这是一项必需的前期工作。智慧公共服务的用户总的来说分为政府工作人员、社会公众、企业单位、其他政府机构、非盈利组织等。如中国上海网站把用户分为市民、企业、投资者、旅游者和需要特殊社会救助的人等,并提供在版面、栏目上一定程度的个性化定制。加拿大的政府网站把用户分为本地用户和外地用户、本国用户和外国用户等。这些网站可以说初步具备了用户细分的理念,但这些分类是比较粗的,还远远不够。今后的智慧公共服务将不再满足于笼统地对用户进行简单分类,这是因为公众的需求是各不相同的,几乎没有规律性可言。只有对用户进行持续的细分工作,才能知道公众的真正需求是什么。可以借鉴统计学的分类方式,把企业按照行业、投资规模、经营范围、产品等进行逐级细分。把社会公众按性别、年龄段、职业、所属地域、对信息的偏好等进行细分。然后有针对性地为不同的用户群提供个性化的服务,这些要求正是体现了市民关系管理的核心思想。需要指出的是,客户的细分也是带有阶段性的,不是一成不变的,用户细分原则和标准要随着社会的发展而发展,随着政府职能的调整而调整。