TVREND / Intelligence Layer
欧洲电视市场
商业情报系统
把散落在 GFK 销量、品牌官网规格、电商渠道价格、人工天梯 四处、各用各型号码的电视数据,
统一对齐到「基础型号」这一把钥匙上,变成一套可视化、可下钻、可对标的商业情报。覆盖 TCL / 三星 / 海信 / LG / 索尼 五大品牌。
为什么要做
同一台电视,四个源用四个名字
电视市场的数据天然割裂:GFK 用一种型号码记销量、渠道用另一种记价格、官网又是第三种规格码、内部天梯图再一套人工命名。
光看任何一个源都不全,想拼起来就得"用眼睛跨表对",又慢又容易错。TvREND 的核心,就是先把它们对齐,再做分析。
🧩 问题:型号码各说各话
同一台 TCL 65″ Mini-LED,GFK 叫 65C89K、渠道叫 65C8K-UK、官网叫 65Q8C、天梯图叫 65C8K —— 系统不知道它们是一台。
🔑 解法:基础型号当唯一钥匙
用「型号字典」把所有衍生码都解析回同一个 基础型号(尺寸+系列,去区域),让销量、价格、规格、档位终于能挂到同一台电视上。
数据结构(核心)
一切围着「基础型号」转
这是整个项目的骨架:四个数据源各自把自己的"衍生型号"解析进字典,得到唯一的"基础型号";所有视图再从这个基础型号读出去。中心-辐射(hub & spoke)。
数据源 → 解析进
GFK 销量65C89K · 衍生码
渠道价格65C8K-UK · 区域码
官网规格65Q8C · 官网码
人工天梯65C8K · 排位
➜
单一真相源
型号字典
base_model
基础型号
= 尺寸 + 系列(去区域)
➜
→ 读出到视图
天梯图 / 规格对比
电商价格监控
GFK 市场分析
AI 报告
已确认 tracked
进了天梯图、已排档位。最高可信。
待确认 candidate
官网/官方确认是真型号,但还没排进天梯(如 2026 新品)。
未确认 unverified
只有 GFK 销量里冒出的名字、基础型号自动抠的,未核对。默认隐藏/不收。
数据怎么来 · 怎么流
四个源,各做一组关键动作
每个源不是"一张静态表",而是一组持续运转的动作 —— 抓、清、对齐、聚合。下面是各源做的关键事(动作,不涉及技术细节)。
GFK 销量
- 每月销量数据入库
- 清洗规整:品牌 / 型号 / 尺寸 / 国家 口径统一
- 按基础型号聚合销量与均价
- 跨年识别真首发年
渠道价格
- 每日抓 Boulanger / Currys 在售价
- 每周反向拉"在售清单"(catalog)
- 自动监测"本周上新"
- 型号解析到基础型号
官网规格
- 抓各品牌官网 / 规格库
- 面板 / 亮度 / 分辨率 / 接口 入库
- 多源参数合并、标注来源
- 带出 2026 新品
人工天梯
- 人工维护档位与排位真相
- 新品自动打分、待人工确认
- 官方对照表纠正异名
- 字典的"高可信种子"
抓取销量/官网/渠道
→
清洗规整字段
→
字典对齐衍生→基础
→
主题表聚合落库
→
后端 + 前端接口 · 页面
数据存储与合成
原料层 → 真相层 → 主题表
抓取来的是「原料」(机器生成、不手改);人工天梯是「真相配方」(加了档位 + 人工校准)。build 把它们带来源戳合成主题表 —— 每个参数都能溯源到底是抓的、还是人填的。
① 原料层 · 机器抓取 / 半自动,不手改(build 的输入)
GGFK 销量
GFK/cleaned/…csv每月销量,清洗统一口径
参显参站
cleaned/product_master + _specs.csv938 页 HTML → 解析,raw 原文(身份 + 规格 两张表)
官品牌官网
manual/{brand}_official.csv已结构化,官网为准
渠渠道价格
Channel-Prices/marts/…parquetBoulanger / Currys 日抓价
② 真相层 · 唯一可手编(build 的核心配方)
手人工天梯真相表
manual/ladder_truth.csv696 行 · 比原料多两样关键:档位 ladder_score(系列级排位)+ 人工校准过的规格;字段已结构化(4K / bool)。这是你日常编辑的那张表。
↓ build 逐格盖来源戳合成(抓取基线 → 人工层 → 官网覆盖 → GFK 兜底)
product_benchmark.csv / .parquet主题表 mart · 790 行 · 每格 field_sources 记录来源 → 喂天梯图 / 型号档案
每个参数的来源戳(5 类)
官官网/官方规格(爬虫抓)
参显参站 displayspecifications
渠渠道网站(价格为主)
GGFK 销量数据
手手工录入(含对标表 / 参数表)
功能模块
五个模块 · 一条分析路径
从"市场有多大"到"哪台卖得好"到"渠道卖多少钱",一条完整链路。下面每块配一张界面预览。
tvrend · 市场总盘
市场总盘品牌竞争市场结构单品操盘
tvrend · 单品走势
看板总览单品走势本周上新跟踪覆盖
本周上新 12
━ Boulanger(法)┅ Currys(英)
tvrend · 型号字典
65C8KTCL · 65″已确认▾ 4 衍生
| 衍生型号 | 渠道版本 | 来源 |
| 65C89K | 线上 | GFK |
| 65C8K-UK | 英版 | Currys |
| 65Q8C | 官网 | 规格库 |
65QN90F三星 · 65″已确认▸ 3 衍生
65G6LG · 65″待确认▸ 5 衍生
tvrend · AI 报告
📌 选区洞察:65″ Mini-LED · 法国
规模 ↑12%TCL 领跑ASP 承压
📷 上方为高仿界面预览(便于离线展示/投屏)。需要真实截图时可放进 public/screenshots/,接入后即自动替换。
路线图
已经做到哪 · 接下来做什么
字典建成后,模块数据正在"初步联通"。下一步把销量×价格×规格×档位真正挂到同一台电视上。
已完成
- GFK 市场数据 5 页 + AI 选区分析
- 产品对标天梯图 + 规格多源对比
- 电商价格监控(法/英渠道,日更)
- 型号字典:五品牌基础↔衍生权威字典
- Samsung / LG 区域变体去碎片化
- A 计划:型号档案(单机 360)+ 档位×销量 + 待对齐清单
刚上线 · 模块初步联通
- 型号字典里点开任意型号 → 单机 360:销量(GFK)+ 各渠道价并排 + 规格 + 衍生
- 「档位 × 销量」散点:左上=黑马(低档高销),右下=叫好不叫座(高档低销)
- 对不齐的型号自动进「待对齐」清单(单一 join key 的剩余缺口)
待办
- Sony / 海信 官方对照表桥接(营销名 ↔ 技术码)
- 字典 ↔ 天梯图 key 对齐
- 待确认 → 已确认 的提升工具
- 三条管线统一规范化函数(根治 gap)