这是一个精华液产品的消费者洞察示例。在分析中引入大语言模型的语义分析和情感分析能力,替代复杂的传统机器学习模型。使得分析更为深入和灵活。
基础数据来源于某主流内容平台与 “精华液” 产品相关的消费者笔记。引入大语言模型对笔记内容进行语义分析和情感评价,并整理获得规整的结构化数据。最终以数据报表的形式展示信息。
交互式报表入口
技术实现
- 在小红书平台上,以“精华液”及相关品牌词为关键词进行搜索筛选消费者笔记。采用 Python 的 DrissionPage 包,抓取约5000条。
- API 接入大语言模型(Google Gemini Flash 1.5)进行语义分析和情感评价:
- 语义分析:提取笔记中有关特定维度的点评内容。如:提取产品使用场景相关语句。
- 情感评价:判断笔记作者对产品和品牌的特定维度的态度。如:对产品功效是否满意。
- 采用 Python 的 jieba 包对语义分析提取的内容进行清洗,整理获得规整的结构化数据。
- 在 Tableau Public 平台进行数据可视化,并展示发布。
局限性
- 受限于内容平台的搜索和算法推送规则,可能出现笔记样本代表性不足的情况。可能需要扩大收集笔记数量来弥补这一问题。
- 大语言模型的语义分析和情感评价准确性受制于模型自身能力,提示词质量和任务复杂程度。如果为了追求时间效率,在提示词中要求大语言模型一次完成多个任务会导致输出结果质量明显下降。
未来改进方向
- 扩大收集笔记数量来提升样本代表性。
- 可以考虑引入两个以上的大语言模型处理相同任务,再对任务输出结果进行对比校验,提升准确性。