#每日精进#2020年7月27日

【总结《一年顶十年》读后感】
https://ask.zkbhj.com/?/article/346
 
【最新的世界格局理解:世界的蛋糕已经不够分了】
全世界的发达国家,都在不同程度上陷入内噬。最直接冲击是就业。
各种冲突、内卷,全世界的蛋糕已经不够分了。
这背后本质,还是科技红利消失殆尽,而下一个科技革命仍然遥遥无期。
现在就仿佛一个炸药桶,各方情绪在里面酝酿。
所有人都不满意目前的世界格局。
但是现在发动战争的成本太高,且搞不好就变成了核战争。所以,对美国来说,中国就是一个标准的背锅对象。
所以,「逆全球化」其实是欧美的逆中国化,遏制中国的商品出口,不跟中国玩了。
逆中国化只能说很难,主要还是成本问题。中国是所有工业门类最齐全的国家,任何零部件都做得出来,甚至形成「供应链网络」,效率非常高。
既然美国要「逆中国化」,要拆解中国的产业链,遏制中国企业的出海路,那我们要做的,自然是高举全球化大旗,坚持改革开放。
对外是一带一路,是中非命运共同体,是欧亚大陆一体化,是推动中日韩自贸区;对内是新农村建设,是乡村振兴战略,把产业过剩能力转向内陆建设。
这就是对美国的最好反制。
你不开拓市场,别人就会抢占先机。
https://mp.weixin.qq.com/s/x6qDmU0-e6um6QiZH7trfA

【每日一个TED:安德鲁·斯坦顿】
在一个推荐系统解构分享PPT中的一句话发现的这个故事。
里面在解释为什么需要推荐系统时,陈述了一个“信息过载“的事实,里面引用了安德鲁·斯坦顿的一句话:


Don't give them 4, give them 2+2


所以查找了相关的原出处,是安德鲁·斯坦顿的一个TED演讲中讲到的,名字叫《一个伟大故事的线索》
https://www.ted.com/talks/andrew_stanton_the_clues_to_a_great_story/transcript?language=zh-cn
【推荐系统解构(电商篇)】
推荐的目的:帮助用户发现好商品,帮助高质量商品触达精准受众(背后对平台和商家就是促进转化)
数据闭环:
  • 用户:浏览、点击、成交、评价、物流全链路闭环数据
  • 商品:潜力、新品、老品、衰落、下架

 
主要召回策略包括:


1) 实时行为召回:在线实时捕捉用户对商品的点击,收藏,加购,购买等反馈行为,并召回相似商品,迅速抓住用户的短期购物需求。
2) 历史行为召回:离线分析用户对商品的历史点击,收藏,加购,购买等反馈行为,并召回相似商品,兼顾用户的长期购物需求。
3) profile召回:从性别,年龄段,设备等多个维度,在线和离线同时对用户进行画像,并召回相对应的热门商品。
4) 热销&趋势召回:分析商品的长期和短期销量变化,召回爆款和近期热点商品。


排序模型建模(电商)相关:


Ctr: Expose -> Click
Cvr: Click -> Order 
GMV-Rate: Click -> GMV
GMV-Pv: Expose -> GMV


排序:一个指标不够—点击和转化:


基础排序公式:score = ctrα * cvrβ * priceγ


假设:
 ctr和cvr估计是准确的, α、β、γ均为1的排序公式才有可能最大化收益 item粒度的估计,而非组合力度的估计 
解决方案: 
通过调整三个因子的大小,如果三者相对稳定可以通过离线统一参数学习 的情况完成,如果不稳定,可通过强化学习来解决这个超参的设定。
复杂排序公式:


score= ctrα * cvrβ * priceγ * mathScoreδ * timeWeightScoreε * mathTypeScoreθ * ···


mathScore:召回分 
typeWeightScore:召回类型分
timeWeight:时间衰减
mathType:召回类型
 
覆盖率:通过类目,品牌,频道,场景等多粒度的打散重排,最大化各个维度的个性化覆盖率。 
疲劳度:通过引入一定的随机因子,针对不同个性化程度,建立合理的轮转机制,保证一定的新颖性。 (这个概念以前没有了解过)

 推荐演进路线:


复杂度:规则 -> 线性 -> 非线性 -> 融合 
时效性:天级 -> 时段级 -> 小时级 -> 实时


人工规则:人工经验提取规则,千人一 面,流量效率低 
线性模型:通过线性模型自动学习人工 提取的特征权重,简单的用 户特征,个性化推荐雏形
非线性模型:树模型及多模型融合,引入更多的上下文特征,加入用 户实时行为反馈,千人千面
深度学习、强化学习与在线学习:对象向量化表达,高维特征 自动提取,特征与模型实时在线更新
 
团队或产品是否应该做推荐功能的决策路径:
• 推荐功能对该产品有无价值(可以) 
• 价值多大(值得) 
• 成本和收益(现在) 
• 优先级(怎样)
比如推荐系统的实时性做到毫秒级是否有必要?
 
分群:根据不同维度对用户进行分群,从而进行针对性推荐
新老用户分群
购买力分群
兴趣分群(群体对类目的强偏好和弱偏好均可以在推荐中使用)
 
Query-Item 文本相关性


文本: 词->短语->语义->主题->句法 
图片: 图->标签&向量


或者把query看成id,与其它id做item2vector
 
PPT下载:
链接:https://pan.baidu.com/s/1YnYkWfpHW3-EokxHmoMrEQ 提取码:li44
 
【如何评估搜索的好坏?看哪些指标】
https://ask.zkbhj.com/?/article/356
 
【Go语言核心36讲:6 程序实体那些事儿】
一对不包裹任何东西的花括号{},除了可以代表空的代码块之外,还可以用于表示不包含任何内容的数据结构(或者说数据类型)。
类型断言表达式的语法形式是x.(T)。其中的x代表要被判断类型的值。
  • struct{},它就代表了不包含任何字段和方法的、空的结构体类型。
  • interface{}则代表了不包含任何方法定义的、空的接口类型。
  • 对于一些集合类的数据类型来说,{}还可以用来表示其值不包含任何元素,比如空的切片值string{},以及空的字典值map[int]string{}。

 
类型字面量:所谓类型字面量,就是用来表示数据类型本身的若干个字符。


string是表示字符串类型的字面量,uint8是表示 8 位无符号整数类型的字面量。再复杂一些的就是我们刚才提到的string,用来表示元素类型为string的切片类型,以及map[int]string,用来表示键类型为int、值类型为string的字典类型。


类型转换表达式:T(x)
x可以是一个变量,也可以是一个代表值的字面量(比如1.23和struct{}{}),还可以是一个表达式。
 
类型转换中的几个陷阱:
  1. 对于整数类型值、整数常量之间的类型转换,原则上只要源值在目标类型的可表示范围内就是合法的。
  2. 虽然直接把一个整数值转换为一个string类型的值是可行的,但值得关注的是,被转换的整数值应该可以代表一个有效的 Unicode 代码点,否则转换的结果将会是"�"(仅由高亮的问号组成的字符串值)string(-1)得到的就是?
  3. string类型与各种切片类型之间的互转

 
一个值在从string类型向byte类型转换时代表着以 UTF-8 编码的字符串会被拆分成零散、独立的字节。
一个值在从string类型向rune类型转换时代表着字符串会被拆分成一个个 Unicode 字符。 
//别名类型,实际上是同一个类型
type myString = string

//类型再定义,实际上是两个不同的类型
type myString string
 
【今日放学别走】

Review推荐系统的新版推荐接口。

排查问题,了解netstat命令显示的tcp和tcp6的区别。# netstat -tlnp | grep :22 tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN 1444/sshd tcp6 0 0 :::22 :::* LISTEN 1444/sshd可以看到,netstat 显示表示 sshd 既监听在 ipv4 的地址,又监听在 ipv6 的地址。tcp6表示监听的是IPv6的。

netstat 只是很真实的显示监听的端口而已,但是需要注意 ipv6 实际上在 Linux 上也支持 ipv4。

https://blog.csdn.net/weixin_4 ... 16951 

0 个评论

要回复文章请先登录注册