读到一篇优秀的论文<HT06, Tagging Paper, Taxonomy, Flickr, Academic Article,ToRead>, 主要有两部分内容:一是考衡Tagging System的方法、二是用户的Tagging动机。其中,讲Tagging动机的部分很平淡,没有新突破。文章的亮点在于作者提出了考衡Tagging System的7个维度,提供了分析问题的新角度。7个维度如下:
- Tagging Rights[权限]
- (系统允许下列角色进行Tagging:仅作者、作者和朋友、所有人,etc)
- 因为不同角色的人有着不同的Tagging动机,这将影响Tagging结果
- Tagging Support [提示]
- (没有任何提示,根据语义提示相关标签,简单列出所有历史标签,etc)
- 提示的好处:让用户提高Tagging效率,也能教育新用户Tagging是什么
- 提示的坏处:最先出现的Tags可能并不是最理想的,但它们会对最终Tagging结果造成很大的影响
- Aggregation Model[模式]
- (对于同一个资源,所有用户共同维护一套标签,或不同用户维护属于自己的那一套标签,etc)
- 前者能够保证标签内容有代表性,能够完整、准确的描述资源
- 后者允许用户通过Tagging对资源进行符合个人使用习惯的标注
- Object Type[资源类型]
- (文本、非文本,etc)
- 影响Tagging结果
- Source of Material[资源来源]
- (用户贡献、系统提供、任意来源,etc)
- 资源来源的差异导致用户对资源的Tagging动机不同,进而影响Tagging结果
- Resource Connectivity[资源间链接]
- (超链、同属某群组,etc)
- 可能导致同一个标签的高频出现
- Social Connectivity[用户社交]
- (方言区、专业领域,etc)
- 拥有社交联系的用户习惯用相同的Tag,导致Tagging结果带有地域特色或专业特色,而且和主流用户的Tagging结果有差异
从这7个维度的角度来分析Delicious和Flickr,两个最具有代表性的Tagging System,其实本质上大相径庭,而用户在这两个网站上表现出来的Tag行为也确实有颇多不同之处。比如因素5导致的差异:Flickr用户更倾向于使 用详尽的Tag来描述资源(自己的照片),以期被其他人搜索到。
从因素4、5的角度来看,也很容易解释为什么豆瓣上的Tag总是固定为:作者、演员、类型、流派了。