以Google Trends为驱动核心数据来源,体现对市场趋势的敏锐捕捉。

数据与算法加持下进行智能化的商品热度分析和选品决策。

整个方案不仅限于当下热度(短期分析),还涉及长期季节性与周期判断,帮助业务在综合信息的基础上更智慧地进行选品与策略规划。

1. 类簇商品的热度分析(短期热度)

过程

  • 为类簇抽取关键词(例如类簇“category_1_cluster_1”的关键词有3个:A、B、C)。

  • 利用 Google Trends 获取过去7天的搜索热度数据(每日0-100标准化值)。

计算方法

  • 对每个关键词的7天热度求平均:

  • \[A_{avg} = \frac{\sum_{t=1}^{7} A_t}{7}, B_{avg} = \frac{\sum_{t=1}^{7} B_t}{7}, C_{avg} = \frac{\sum_{t=1}^{7} C_t}{7}\]
  • 若无特殊偏好,权重相等(1/3):

  • 类目热度分值= \(\frac{A_{avg}+B_{avg}+C_{avg}}{3}\)

结果示例

  • 假设 \(A_{avg}=60\), \(B_{avg}=50\), \(C_{avg}=70\),则 类目热度分值=60+50+703= \(\frac{A_{avg} + B_{avg} + C_{avg}}{3}\) = \(\frac{60+50+70}{3}\) = 60

这表示该类簇商品在最近7天的平均热度约为60,属于中上水平。


2. 季节性分析(长期历史数据)

为研究类簇关键词是否存在季节性,需要1-2年乃至更长时间跨度的Google Trends数据(如过去5年,按周或按日粒度)。通过对长期数据的分析,我们得到季节性强度、周期长度及具体高峰周期。

时间序列分解 (Seasonal Decomposition)

过程

  • 获取该关键词在过去多年的时间序列数据(如周数据)。

  • 使用 seasonal_decompose 函数分解时间序列: \(时间序列=趋势(Trend)+季节性(Seasonal)+残差(Residual)\text{时间序列} = \text{趋势(Trend)} + \text{季节性(Seasonal)} + \text{残差(Residual)}\)

季节性强度计算

根据公式:

\[季节性强度=1−Var(残差) Var(残差 + 季节性)\text{季节性强度} = 1 - \frac{\text{Var(残差)}}{\text{Var(残差 + 季节性)}}\]

解释

  • 若此值接近1,季节性成分对整体波动的贡献度极大,即搜索热度有很强的季节性规律。

  • 若此值接近0,则季节性影响很弱。

结果示例: 假设通过计算得出季节性强度为0.7,这意味着季节性在数据波动中占相当大比例,商品搜索热度有明显的季节性特征。


3. 周期长度识别

利用以下方法确定季节性周期:

  1. 业务经验:若该类商品(如保温杯)在冬季需求高,可能存在年周期(约12个月)。

  2. 自相关分析(ACF):对长期数据绘制ACF图,若在滞后52周(约一年)出现显著自相关峰值,说明存在年度周期性。

  3. 快速傅里叶变换(FFT):对时间序列做FFT,若在对应年周期频率上有主峰,则进一步确认年度周期。

结果示例: 假设通过ACF和FFT确认,在每年接近年底至年初(约52周周期)搜索热度重复出现高峰,这说明周期长度为一年。


4. 季节性高峰周期

在明确有年周期的情况下,可进一步观察历史数据中哪些时间段热度最高。例如:

  • 每年11月末至12月底搜索热度逐步上升,并在12月中下旬至1月初达到峰值。

  • 每年此时段消费者为节日礼品采购、冬季使用需求提升,导致对该类商品搜索量激增。

结果示例: 过去三年数据显示,每年11月末(如感恩节后)开始热度上行,12月中旬达到高位,最高峰常出现在圣诞节前后至新年初(12月下旬-1月上旬)。这正是季节性高峰周期。


5. 季节性理由解释

为什么在这个时期会有热度高峰?可能的原因包括:

  • 气候因素:冬季气温降低,人们对保温杯的需求上升。

  • 节假日经济:感恩节、圣诞节、新年礼品需求旺盛,消费者在这一期间更愿意搜索和购买保温杯等季节相关产品。

  • 促销活动:电商平台和品牌方在年底进行促销活动,增加消费者搜索和购买行为。

这些外部因素与周期性搜索高峰完全契合,形成了清晰的季节性理由。


6. 商品热度结果

  1. 类簇商品热度(短期): 根据过去7天Google Trends数据的平均值或加权平均值,得到当前类簇的近期热度分值(如60分),可用于实时市场监测和短期运营决策。

  2. 季节性强度: 通过全年或多年的数据分解和计算季节性强度(如0.7),证明商品热度具有较强的季节性特征。

  3. 周期长度识别: 利用ACF和FFT分析,识别出商品热度存在年度周期(约52周),每年重复出现类似的搜索模式。

  4. 季节性高峰周期: 确定季节性高峰集中在每年11月末至12月下旬(节日季和冬季交叠),这是商品热度最高的时间段。

  5. 理由: 高峰出现的原因符合消费者购买习惯、气候需求和节日促销活动这一系列市场与季节性逻辑。

案例:保温杯Thermos Cup

Thermos Cup
Category: All categories        
        
Week        Thermos Cup: (United States)
2019-12-01        30
2019-12-08        27
2019-12-15        26
2019-12-22        22
2019-12-29        14
2020-01-05        15
2020-01-12        15
2020-01-19        15
2020-01-26        12
2020-02-02        14
2020-02-09        15
2020-02-16        14
2020-02-23        11
2020-03-01        16
2020-03-08        13
2020-03-15        10
2020-03-22        5
2020-03-29        8
2020-04-05        11
2020-04-12        5
2020-04-19        8
2020-04-26        7
2020-05-03        10
2020-05-10        13
2020-05-17        13
2020-05-24        11
2020-05-31        11
2020-06-07        13
2020-06-14        12
2020-06-21        11
2020-06-28        15
2020-07-05        11
2020-07-12        13
2020-07-19        13
2020-07-26        11
2020-08-02        14
2020-08-09        12
2020-08-16        16
2020-08-23        9
2020-08-30        12
2020-09-06        12
2020-09-13        12
2020-09-20        14
2020-09-27        15
2020-10-04        19
2020-10-11        13
2020-10-18        13
2020-10-25        12
2020-11-01        11
2020-11-08        19
2020-11-15        19
2020-11-22        19
2020-11-29        28
2020-12-06        29
2020-12-13        27
2020-12-20        20
2020-12-27        15
2021-01-03        20
2021-01-10        14
2021-01-17        14
2021-01-24        16
2021-01-31        15
2021-02-07        13
2021-02-14        15
2021-02-21        13
2021-02-28        10
2021-03-07        13
2021-03-14        10
2021-03-21        11
2021-03-28        12
2021-04-04        13
2021-04-11        13
2021-04-18        11
2021-04-25        14
2021-05-02        12
2021-05-09        14
2021-05-16        13
2021-05-23        12
2021-05-30        12
2021-06-06        19
2021-06-13        13
2021-06-20        8
2021-06-27        13
2021-07-04        11
2021-07-11        13
2021-07-18        13
2021-07-25        16
2021-08-01        16
2021-08-08        15
2021-08-15        19
2021-08-22        23
2021-08-29        15
2021-09-05        16
2021-09-12        15
2021-09-19        17
2021-09-26        16
2021-10-03        12
2021-10-10        14
2021-10-17        15
2021-10-24        18
2021-10-31        18
2021-11-07        21
2021-11-14        19
2021-11-21        24
2021-11-28        24
2021-12-05        27
2021-12-12        24
2021-12-19        26
2021-12-26        18
2022-01-02        22
2022-01-09        15
2022-01-16        17
2022-01-23        16
2022-01-30        17
2022-02-06        22
2022-02-13        16
2022-02-20        13
2022-02-27        17
2022-03-06        17
2022-03-13        17
2022-03-20        17
2022-03-27        15
2022-04-03        17
2022-04-10        18
2022-04-17        19
2022-04-24        18
2022-05-01        15
2022-05-08        15
2022-05-15        13
2022-05-22        16
2022-05-29        14
2022-06-05        10
2022-06-12        20
2022-06-19        18
2022-06-26        14
2022-07-03        16
2022-07-10        16
2022-07-17        17
2022-07-24        20
2022-07-31        21
2022-08-07        20
2022-08-14        20
2022-08-21        21
2022-08-28        19
2022-09-04        20
2022-09-11        21
2022-09-18        21
2022-09-25        17
2022-10-02        18
2022-10-09        20
2022-10-16        19
2022-10-23        24
2022-10-30        27
2022-11-06        21
2022-11-13        24
2022-11-20        27
2022-11-27        32
2022-12-04        31
2022-12-11        35
2022-12-18        39
2022-12-25        39
2023-01-01        28
2023-01-08        31
2023-01-15        22
2023-01-22        26
2023-01-29        24
2023-02-05        20
2023-02-12        17
2023-02-19        21
2023-02-26        21
2023-03-05        19
2023-03-12        18
2023-03-19        21
2023-03-26        19
2023-04-02        19
2023-04-09        18
2023-04-16        24
2023-04-23        21
2023-04-30        19
2023-05-07        17
2023-05-14        17
2023-05-21        16
2023-05-28        18
2023-06-04        19
2023-06-11        18
2023-06-18        20
2023-06-25        20
2023-07-02        14
2023-07-09        21
2023-07-16        18
2023-07-23        23
2023-07-30        23
2023-08-06        26
2023-08-13        26
2023-08-20        26
2023-08-27        20
2023-09-03        21
2023-09-10        19
2023-09-17        19
2023-09-24        22
2023-10-01        22
2023-10-08        25
2023-10-15        19
2023-10-22        20
2023-10-29        25
2023-11-05        27
2023-11-12        27
2023-11-19        36
2023-11-26        35
2023-12-03        39
2023-12-10        40
2023-12-17        45
2023-12-24        37
2023-12-31        89
2024-01-07        100
2024-01-14        49
2024-01-21        52
2024-01-28        43
2024-02-04        35
2024-02-11        35
2024-02-18        29
2024-02-25        24
2024-03-03        19
2024-03-10        16
2024-03-17        19
2024-03-24        22
2024-03-31        17
2024-04-07        20
2024-04-14        23
2024-04-21        19
2024-04-28        18
2024-05-05        20
2024-05-12        15
2024-05-19        21
2024-05-26        15
2024-06-02        19
2024-06-09        18
2024-06-16        18
2024-06-23        23
2024-06-30        22
2024-07-07        20
2024-07-14        15
2024-07-21        19
2024-07-28        23
2024-08-04        21
2024-08-11        27
2024-08-18        20
2024-08-25        25
2024-09-01        27
2024-09-08        24
2024-09-15        24
2024-09-22        29
2024-09-29        23
2024-10-06        18
2024-10-13        22
2024-10-20        21
2024-10-27        25
2024-11-03        26
2024-11-10        39
2024-11-17        34
2024-11-24        36
2024-12-01        39

下面以您提供的 Thermos Cup (美国)时间序列数据为例,演示如何得到最近7天(或最近1周)热度值、打上热度分值,并分析商品的季节性周期及原因。

说明:您提供的数据是按周(Week)为粒度的 Google Trends 数据,这意味着每一行代表该周的平均热度,而非每日数据。因此,最近7天的热度基本上就对应数据表中最后一行(或最后一周的数据)。如果实际需要更高分辨率(逐日数据)来计算精确的7日平均值,需要使用Google Trends更高频率的数据。在此,我们以最后一周的值作为近7天热度参考。


  1. 最近7天(1周)的热度值与热度分值
  • 数据最后一行:
2024-12-01   39
  • 这里的39表示最近一周(2024-11-24到2024-12-01这一周)的热度平均值为39。 若您需要直接给商品打上一个近期热度分值,这个值就可以作为近期(近7天)热度分值的基准分数。

若您要进行对比(例如与过去4周平均对比或与去年同期对比),可进一步计算:

  • 最近4周平均热度:取最后4个数据点平均值。

  • 与去年同期(2023年同一周)的热度对比:比如2023-12-03一周的值为39(2023-12-03的值为39),与当前2024-12-01这一周的39对比,基本持平。

这样,您便可以基于相对值判断当前热度处于一个中等水平。若在历史数据中该值偏高,可以认为商品近期热度较高;若偏低,则热度较低。


  • 季节性分析与周期判断

要分析商品搜索热度的季节性,一般需要至少一年的数据来观察规律。您提供的数据从2019-12-01到2024-12-01,超过5年的数据足以分析年度周期。

方法说明

(1)观察趋势与季节特征: 从原始数据中可以留意每年年底和年初的值是否存在峰值。例如:

  • 2024-01-07(100)的峰值:2024年初时热度达到非常高的100。

  • 2023-01-08(31)相比前后几周也有一定提升,但2024年初峰值特别明显。

  • 类似地,2022-12-11(35)、2022-12-18(39)、2022-12-25(39)在年底时段呈现上升,到2023-01-01这周又出现较大幅度的上升(28→31→22→…但2024年初才是最高峰100)。

  • 再看2021年、2020年的年底和年初,也存在一定的热度上升现象(例如2020年12月和2021年1月一带值较高)。

这种年底至年初热度上行的趋势可能与假日季(Holiday Season)和新年期间消费者对保温杯需求或搜索兴趣上升有关。美国市场在假日季及年初(可能涉及新年礼品、冬季使用需求)出现搜索量高峰是有逻辑上的商业和季节理由的。

(2)时间序列分解(技术分析): 若使用 statsmodels 的季节性分解(seasonal_decompose)函数对这几年的周数据做分解,并将 period=52(每年约52周)作为季节周期参数,大概率会看到每年在12月-1月左右的季节性成分显著提升,这说明存在年度周期性。

(3)ACF(自相关)分析: 通过绘制自相关函数图(ACF)对该序列进行分析,如果在滞后约52周的位置出现明显的自相关峰值,则意味着有年度周期性。这是因为一年约52周,若一年后同一时间热度表现相似,就会在lag=52处出现自相关高点。

季节性强度

季节性强度可通过对分解后的季节项与残差项的方差比来确定。如果季节性成分变化显著且重复,在整体波动中所占比例就高,季节性强度就大。例如,如果分解后发现季节性占波动的50%以上,则说明季节性很强。

周期性质及理由

  • 周期性质:从上述观察可以推测,每年年底到翌年年初(12月下旬到1月初)是一个搜索热度高峰期。这暗示出一个年度周期(大约52周)。

  • 理由(行业逻辑):美国消费者在年底和新年期间通常购买礼品或进行节日促销购物,气候寒冷也使得保温杯需求提高,从而导致该期间搜索兴趣上升。这种需求的重复出现会年复一年地呈现出来。


  • 例证

通过对过去数年的数据观察:

  • 2019年底—2020年初的热度在(2019-12-01为30,2020-01-07左右虽未给出该确切周但能看到2020-01-05、2020-01-12都是15上下,当时热度较低或中等),相比2024年初的最高值100不如后期那么明显,但仍存在一定季节波动。

  • 随着时间推移,2024年初热度陡增至100,这可能是某种促销、品牌推广、节日礼品需求等因素引起,但与寒冬和假日季需求上升这一年周期性需求逻辑是一致的。

总之,这个周期性并非日历精确的对齐每年同一周都一样,但可以看出每年年底和初年出现比其他时间更高的热度,有明显季节规律。


结果分析

  • 最近7天热度分值:最后一周(2024-12-01)的热度为39,可作为该商品当前热度的短期评价指标。

  • 季节性强度:从数据中可观察到每年年底与年初的热度较高现象,表明年度季节性存在并较为显著。若进一步通过时间序列分解和统计分析,相信季节性强度会较高(原因:年末假日季和冬季需求)。

  • 周期:周期为年度周期(约52周),每年年末至年初出现搜索热度高峰。

  • 理由:美国消费者在假日季、冬季和新年期间对保温杯的兴趣上升导致季节性周期出现。这与市场实践(如假日礼品消费、冬季保温需求)吻合。

通过这种分析,您可以为该商品的市场策略和库存计划提供数据参考。

根据所提供的多年数据,可以通过对比每年同一时期的热度值来提炼出较为具体的季节性高峰周期。纵观2019年至2024年的数据,尽管各年度峰值大小有所波动,但基本模式相对清晰:每年从11月中下旬开始热度提升,12月达到较高水平,峰值大多出现在12月下旬至次年1月上旬左右。

以下为更详细的年度观察及峰值区间总结(以周为粒度):

  1. 2020年初及2020年末-2021年初

    • 2020年末时段(如2020-11-29周热度28、2020-12-06周29)显示出年底热度较普通月份明显偏高,但峰值并不极端高,仅在11月底至12月上旬略有提高。

    • 2021年初(2021-01-03周20)有一定上升,但不如后期年份明显。

  2. 模式:2020年年底(11月末至12月初)出现一定热度提升,但峰值不太显著。

  3. 2021年末-2022年初

    • 2021-11-28周热度24,2021-12-05周27,随后12月中旬仍保持在24-26的较高水平。

    • 2022-01-02周为22,相较12月的峰值略有回落,但年底这段时间(11月底至12月中旬)依然显示出高于其他时间的水平。

  4. 模式:热度在11月底开始上扬,12月上旬至中旬达到相对高点(24-27左右)。

  5. 2022年末-2023年初

    • 2022-11-27周32开始,至12月11周35,12月18和25两周保持在39的较高值。

    • 2023-01-01周热度为28,较12月底略微下降,但仍明显高于年中水平。

  6. 模式:热度从11月末(30+)一路攀升到12月底达39左右的高点,显示出年底假期阶段(感恩节后至圣诞新年假期)的热度高峰。

  7. 2023年末-2024年初(最典型的高峰)

    • 2023-11-19周36,随后连续数周稳步上升: 2023-12-10周40 → 2023-12-17周45 → 2023-12-24周37 → 2023-12-31周89 → 2024-01-07周达到历史高点100。

    • 在2024年1月初达到顶峰(100)后,2024-01-14周回落至49,但仍高于普通月份的平均水平。

  8. 模式:从11月中旬热度即达到30+以上,然后在12月份持续增长,在年末年初(12月底至1月初)冲击高峰(最高点出现在新年后第一周,达到100)。

综合多个年度数据来看(2020-2024):

  • 每年约从11月下旬开始,Thermos Cup 这一关键词的热度明显比前几个月提升。

  • 12月中旬至12月下旬通常为热度相对较高的时期。某些年份(尤其后期数据,如2022年底和2023年底)表现出更明显的峰值。

  • 高峰值最为明显的年份在2023年末至2024年初,热度从12月中旬持续升高,在12月底或新年伊始(1月上旬)达到年度最高点。

结论

  • 季节性高峰周期大致在每年11月下旬开始抬头,12月中下旬达到较高水平,并在12月下旬至次年1月上旬左右形成热度峰值

  • 原因上与美国的假日季(圣诞节、新年)、寒冷季节对保温杯需求和搜索兴趣的提升有关。该季节性需求在最近几年(2023年底-2024年初)表现尤为明显,出现了显著的年度峰值。


<
Previous Post
Scaling Test Time Compute 核心问题、解决方法、技术对比与总结
>
Blog Archive
Archive of all previous blog posts