美国宾夕法尼亚州匹兹堡市卡内基梅隆大学的Tom M. Mitchell和同事,首先确定了来自12个语义类别——包括动物、服装、工具和交通工具——的60个具体名词的语义构成。在一个总计达10000亿个词汇的文本数据库中,他们评估了这些名词出现在25个动词邻近的频率,这些动词不是指示发动机便是指感官运动。基于这些动词与名词联合出现的频率,每个动词被赋予了针对每个名词的频率值。依据这种方式,计算机创建了“语义识别标志”,能够捕捉每个名词的含义。研究人员同时获得了来自9名志愿者的有关60个名词的神经活动模式——这些志愿者被暴露于一部功能性核磁共振(fMRI)扫描仪下,并被要求思考每一个名词。