推荐算法---peason相关系数

简介:
#!/usr/local/bin/python2.7
# encoding: utf-8


import sys
import os

from argparse import ArgumentParser
from argparse import RawDescriptionHelpFormatter

from math import sqrt

import moivescore  # import module defined by yourself 
from rope.base.prefs import Prefs
from bokeh.models.tools import Scroll



# 利用欧几里德距离评价相关性
def sim_distance(prefs,p1,p2):
    si = {}  # mark the moive name that both appeared  p1 and p2
    for item in prefs[p1]:
#         print(item)
        if item in prefs[p2]:
            si[item] = 1
#             print(si)
    
    if len(si)==0: return 0  #  have no same moive
    
    # 利用欧几里德距离评价相关性
    sum_of_squares = sum([pow(prefs[p1][item]-prefs[p2][item], 2) for item in prefs[p1] if item in prefs[p2] ])
    
#     print(sum_of_squares)
    print(1/(1+sqrt(sum_of_squares)))
    
    return 1/(1+sqrt(sum_of_squares))
   
# 利用皮尔逊相关系数进行评价,可以修正评分中的夸大分值    
def sim_pearson(prefs,p1,p2):
    si = {}
    for item in prefs[p1]:
        if item in prefs[p2]:
            si[item] = 1
            
    if len(si)==0: return 0
    
    n = len(si)
    # EX
    sum1 = sum(prefs[p1][item] for item in si)
    # EY
    sum2 = sum(prefs[p2][item] for item in si)
    
    # EX2
    sqsum1 = sum(pow(prefs[p1][item],2) for item in si)
    # EY2
    sqsum2 = sum(pow(prefs[p2][item],2) for item in si)
    
    #EXY
    psum = sum(prefs[p1][item]*prefs[p2][item] for item in si)
    
    #EXY-EX*EY
    num = psum-(sum1*sum2/n)
    
    den = sqrt((sqsum1-pow(sum1,2)/n)*(sqsum2-pow(sum2,2)/n))
    
    if den == 0: return 0
    
    r = num/den
#     print(r)
    return r

# print(moivescore.critics['Lisa Rose']) # key and value

# print(moivescore.critics['Lisa Rose']['Lady in the Water'])

# sim_distance(moivescore.critics, 'Lisa Rose', 'Gene Seymour')
# sim_distance(moivescore.critics, 'Lisa Rose', 'Michael Phillips')
# sim_distance(moivescore.critics, 'Lisa Rose', 'Claudia Puig')
# sim_distance(moivescore.critics, 'Lisa Rose', 'Mick LaSalle')
# sim_distance(moivescore.critics, 'Lisa Rose', 'Jack Matthews')
# sim_distance(moivescore.critics, 'Lisa Rose', 'Toby')
# sim_distance(moivescore.critics, 'Lisa Rose', 'xiaoYu')
print('--------------------pearson--------------------------------')
# sim_pearson(moivescore.critics, 'Lisa Rose', 'Gene Seymour')
# sim_pearson(moivescore.critics, 'Lisa Rose', 'Michael Phillips')
# sim_pearson(moivescore.critics, 'Lisa Rose', 'Claudia Puig')
# sim_pearson(moivescore.critics, 'Lisa Rose', 'Mick LaSalle')
# sim_pearson(moivescore.critics, 'Lisa Rose', 'Jack Matthews')
# sim_pearson(moivescore.critics, 'Lisa Rose', 'Toby')
# sim_pearson(moivescore.critics, 'Lisa Rose', 'xiaoYu')


# find the person who have the most likely taste with you
def topMatches(prefs,person,n=5,similarity=sim_pearson):
#     scores = [other for other in prefs if person!=other]
#     print(scores)
    scores = [(other,similarity(prefs,person,other)) for other in prefs if person!=other]
#     print(scores)
    scores.sort()
    scores.reverse()
    print(scores)
    print(scores[0:n])
    return scores[0:n] # return existing data from 0 to n
    
    
# topMatches(moivescore.critics, 'Lisa Rose', 1)

# use pearson to provide us a recommendation of the film
def getRecommendation(prefs,person,similarity=sim_pearson):
    totals={} # sum (similarity*score) all the movie which i havent see
    simSums={} # sum similarity of all the movie which i havent see
    for other in prefs:
        if other == person: continue
        sim = similarity(prefs,person,other)
        
        if sim<=0: continue
        
        for item in prefs[other]:
            # only estimate the movie this person never watched before, means he has no score on this movie
            if item not in prefs[person] or prefs[person][item]==0:
                totals.setdefault(item,0)
                # similarity*score
                totals[item]+=prefs[other][item]*sim
                
                simSums.setdefault(item,0)
                simSums[item]+=sim
                
                
    print(totals)
    print(simSums)
    
    # create a ranking list
    rankings = [(item,total/simSums[item]) for item,total in totals.items()]
    rankings.sort()
    rankings.reverse()
    print(rankings)
    return rankings
    
    
getRecommendation(moivescore.critics, 'Toby')
相关文章
|
2天前
|
SpringCloudAlibaba 负载均衡 Dubbo
微服务架构下Feign和Dubbo的性能大比拼,到底鹿死谁手?
本文对比分析了SpringCloudAlibaba框架下Feign与Dubbo的服务调用性能及差异。Feign基于HTTP协议,使用简单,适合轻量级微服务架构;Dubbo采用RPC通信,性能更优,支持丰富的服务治理功能。通过实际测试,Dubbo在调用性能、负载均衡和服务发现方面表现更出色。两者各有适用场景,可根据项目需求灵活选择。
338 123
微服务架构下Feign和Dubbo的性能大比拼,到底鹿死谁手?
|
1天前
|
Java 数据库 数据安全/隐私保护
Spring 微服务和多租户:处理多个客户端
本文介绍了如何在 Spring Boot 微服务架构中实现多租户。多租户允许单个应用实例为多个客户提供独立服务,尤其适用于 SaaS 应用。文章探讨了多租户的类型、优势与挑战,并详细说明了如何通过 Spring Boot 的灵活配置实现租户隔离、动态租户管理及数据源路由,同时确保数据安全与系统可扩展性。结合微服务的优势,开发者可以构建高效、可维护的多租户系统。
179 127
|
5天前
|
人工智能 JavaScript 测试技术
Qwen3-Coder入门教程|10分钟搞定安装配置
Qwen3-Coder 挑战赛简介:无论你是编程小白还是办公达人,都能通过本教程快速上手 Qwen-Code CLI,利用 AI 轻松实现代码编写、文档处理等任务。内容涵盖 API 配置、CLI 安装及多种实用案例,助你提升效率,体验智能编码的乐趣。
436 106
|
1天前
|
Web App开发 前端开发 API
在折叠屏应用中,如何处理不同屏幕尺寸和设备类型的样式兼容性?
在折叠屏应用中,如何处理不同屏幕尺寸和设备类型的样式兼容性?
212 124
|
5天前
|
JSON fastjson Java
FastJson 完全学习指南(初学者从零入门)
摘要:本文是FastJson的入门学习指南,主要内容包括: JSON基础:介绍JSON格式特点、键值对规则、数组和对象格式,以及嵌套结构的访问方式。FastJson是阿里巴巴开源的高性能JSON解析库,具有速度快、功能全、使用简单等优势,并介绍如何引入依赖,如何替换Springboot默认的JackJson。 核心API: 序列化:将Java对象转换为JSON字符串,演示对象、List和Map的序列化方法; 反序列化:将JSON字符串转回Java对象,展示基本对象转换方法;
|
6天前
|
缓存 JavaScript 前端开发
JavaScript 的三种引入方法详解
在网页开发中,JavaScript 可通过内联、内部脚本和外部脚本三种方式引入 HTML 文件,各具适用场景。本文详解其用法并附完整示例代码,帮助开发者根据项目需求选择合适的方式,提升代码维护性与开发效率。
211 110