Reading List 2015-03-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Reading List 2015-03

阅读量：6349 次

发布时间：2019-06-22

本文共 3201 字，大约阅读时间需要 10 分钟。

这个月主要在关注流式处理和推荐系统方面的技术。如何从零构建一个推荐系统？网上能找到的有指导意义的资料太少，只能一点点摸索？

Spark

Spark在腾讯数据仓库TDW的应用

Spark on Yarn：小火花照亮大数据

Spark on Yarn：性能调优

Spark 教程

Spark Shell Examples

Spark SQL join 的例子：

Spark Cook Book：

Spark做推荐系统

spark机器学习

Spark MLlib系列(一)：入门介绍

Spark MLlib系列(二)：基于协同过滤的电影推荐系统

Spark机器学习库mllib之协同过滤

快刀初试：Spark GraphX在淘宝的实践

“Spark上流式机器学习算法实现”终期检查报告

Spark 0.9.1 MLLib 机器学习库简介

Spark MLlib 概念 6：ALS（Alternating Least Squares） or (ALS-WR)

MLlib实践经验(1)

研究机器学习之MLlib实践经验

协同过滤算法在MapReduce与Spark上实现对比

ItemBased with Spark

Collaborative Filtering with Spark

Movie Recommendations and More With Spark

Movie Recommendation with Mllib

基于ALS算法的简易在线推荐系统

ALS 在 Spark MLlib 中的实现

阿基米德项目ALS矩阵分解算法应用案例

ALS矩阵分解推荐模型

协同过滤之ALS-WR算法

Spark上矩阵运算库

用MongoDB和Spark实现电影推荐

基于Spark构建推荐引擎之一：基于物品的协同过滤推荐

2015的 spark-summit ，使用 Spark 实时推荐系统：

基于PredictionIO的推荐引擎打造，及大规模多标签分类探索

PDF：MLlib: Scalable Machine Learning on Spark

使用Spark的MLlib、Hbase作为模型、Hive作数据清洗的核心推荐引擎,在Spark on Yarn测试通过

推荐系统

推荐算法总结Recommendation

Collaborative Filtering and Recommender Systems By Navisro Analytics，里面有推荐系统的步骤

Item Based Collaborative Filtering Recommendation Algorithms

协同过滤CF推荐介绍

Python 实现的机器学习库 scikit-learn：

免费好书！《Practical Machine Learning: Innovations in Recommendation》机器学习&推荐系统：简单构建有效的推荐系统；借搜索技术创新应用部署大规模推荐系统；从实时数据中提取信息改进推荐系统的方法和技巧。超赞&推荐！另:讨论推荐系统设计模式的文章:

推荐系统中最核心的数据之一是 user profile 数据。我们需要从大量历史用户行为中分析和挖掘各种维度的特征，来刻画用户的兴趣偏好。在QCon北京2015 @今日头条架构师丁海峰，将分享中会介绍今日头条 user profile 系统的现状，面临的问题，系统演进，以及技术架构中的关键问题。

电商网站用户，可分为两类：有购买欲望及明确购买目标，有购买欲望但无明确购买目标。前者为主动用户，决策较独立；后者为被动用户，需要被引导和刺激，协助其明确购买目标，如亚马逊强大的推荐系统，听说贡献了30%以上销售额。针对主动用户和被动用户，网站该如何设计呢？

【重磅！大数据工程师的年终总结&算法数据的思考】一个优秀的推荐算法，一个优秀的推荐系统的确可以为企业创造很多价值，曾经和某知名电商网站的数据总监交流，他们的推荐系统实实在在地把销售额增加了15%，但是过于神话迷恋推荐算法和过于看扁推荐算法都是一种偏激的行为

今天读了两篇关于微博推荐的文章。对推荐系统了解不深，感觉微博推荐应该是个非常困难的问题。推荐的不是普通的item而是”人”, 一个人有多重身份，一般需要一个较长的熟悉过程，还有线上线下两个不同的交际圈子，增加了信息不对等。关注一个人也有累加的时间成本，得到的信息是否能抵消成本也是一个问题。

：最近看了几个推荐系统的文章，有入门级的教程，讲解推荐系统的经典解决方案，还有进阶体验，介绍如何在大数据平台（Hadoop，spark, mogodb)上形成实时推荐。还有两个搞笑的文案调侃推荐系统的用户体验。

使用Oryx和CDH进行个性化推荐

Myrrix 分布式推荐

使用Mahout Kmeans算法进行中文聚类

漫谈“推荐系统”

自己动手写一个推荐系统

什么是好的推荐系统

58同城的大数据环境下实现一个O2O通用推荐引擎的实践

58同城推荐系统架构设计与实现

构建一个基于del.icio.us的链接推荐系统

基于协同过滤构建简单推荐系统

使用Python简易推荐系统的构建

微博推荐算法简述

使用 Azure、Hadoop 和 Mahout 构建一个推荐系统

Netflix的推荐和个性化系统架构

探索推荐引擎内部的秘密

美团推荐算法实践

百分点推荐引擎——从需求到架构

QConShanghai2013-杨浩-360推荐系统实践.pdf

大规模电商推荐系统应用经验分享

打造最适合产品的推荐系统

爱奇艺推荐系统的整体技术架构

推荐系统架构小结

淘宝推荐系统的学习

协同过滤算法：在线推荐系统如何工作？

活用您的 Big Data，實現線上服務行銷的精準推薦

推荐系统规划

Github 上大数据/数据挖掘/推荐系统/机器学习相关资源

计算准确率、召回率、覆盖率

个性化推荐

[文章]《Personalized Recommendations at Etsy》介绍Etsy采用的个性化推荐算法，包括矩阵分解、交替最小二乘、随机SVD和局部敏感哈希等

[文章]《Pinnability: Machine learning in the home feed》介绍Pinterest的Pinnability，基于机器学习提供个性化内容(推荐)列表

：主流商品往往代表了绝大多数用户的需求，而长尾商品往往代表了一小部分用户推荐系统的个性化需求。因此，如果要通过发掘长尾提高销售额，就必须充分研究用户的兴趣，而这正是个性化推荐系统主要解决的问题。

：今日头条是一款基于数据化挖掘的个性化信息推荐引擎。根据微博行为、阅读行为、地理位置、职业年龄等挖掘出兴趣。用户每次动作后，10秒内更新用户模型。对每条信息提取几十个到几百个高维特征进行降维、相似计算、聚类等去重；通过大数据的处理进行个性化推荐，使用户无需设置，即可享受高质量信息

大数据系列文章第2篇——大数据之“用户行为分析”：

个性化推荐技术的十大挑战：

个性化推荐系统的简单实现：

用Kiji构建实时、个性化推荐系统：

一种基于LBS的移动个性化推荐系统：

基于大规模隐式反馈的个性化推荐

流式处理

江南白衣Calvin 写的《Storm笔记》，非常详细：

Hadoop Streaming程序基础

Hadoop Streaming 实战：输出文件分割

Hadoop Streaming原理及实践

Hadoop-Streaming实战经验及问题解决方法总结

总结：作为一个程序员，最重要的能力是自我学习、归纳、总结，知识在于总结而不是分享。如何把大量看到的、听到的信息、知识、笔记等转化为自己的经验值，是需要认真考虑的一件事情。

转载地址：http://krtla.baihongyu.com/

你可能感兴趣的文章

spark复习总结02

李瑞红201771010111《第九周学习总结》

[译]ZOOKEEPER RECIPES-Barriers

navicat下载安装和激活一分钟完成

6_5 一些有用网址

NFC 鏈表操作

Ubuntu里设置python默认版本为python3（转载）

快排+折半查找

c# GC 新典型

ssh bash 通配符

seajs在jquery多个版本下引用jquery的插件的方案

关于网络上java，php和.net的“口角之争“的一点想法！

python 第二周（第十三天）我的python成长记一个月搞定python数据挖掘！(21) -正则表达式re...

[POI2011]SEJ-Strongbox

Android开发Intent应用概述

【Go】并发编程

VMware虚拟化NSX-Manager命令行更改admin用户密码

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-12 10:45:26 当前IP: 3.15.192.89 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我