sistemas recomendadores basados en...

38
Estudiante: Juan Pablo Salazar Fernández Profesor: Dr. Denis Parra Santander Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ciencia de la Computación PRESENTACIÓN CURSO SISTEMAS RECOMENDADORES SISTEMAS RECOMENDADORES BASADOS EN GRAFOS 05 de noviembre de 2015

Upload: phungnhan

Post on 03-Nov-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Estudiante:JuanPabloSalazarFernández

Profesor:Dr.DenisParraSantander

Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ciencia de la Computación

PRESENTACIÓNCURSOSISTEMASRECOMENDADORES

SISTEMASRECOMENDADORES

BASADOSENGRAFOS

05denoviembrede2015

1.  A Graph-based Recommender System for DigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen. InProceedings of the 2ndACM/IEEE-CS joint conference onDigital libraries (JCDL'02).ACM,NewYork,NY,USA,65-73.

2.  A Graph-based mode l f o r con tex t-awarerecommendation using implicit feedback data. Yao,W.,He,J.,Huang,G.,Cao,J.,&Zhang,Y.WorldWideWeb(2015)18:1351–1371

›  Artículosincluidos

2

1.   Introducción.2.   Incorporacióndeinformacióndecontexto.3.   SolucióndeHuanget.al.(2002)•  Problemaaresolver.•  Modeloutilizado.•  Evaluaciónyresultados.

4.   SolucióndeYaoet.al.(2015)•  Problemaaresolver.•  ModeloMulti-LayerContextGraph(MLCG)•  Evaluaciónyresultados.

5.   Conclusionesycomentarios.

›  Agenda

3

1.  Aporteaproblemade“informationoverload”.

2.  Feedbackexplícito,matricesusuario-itemrelativamentedensas.

3.  Necesidaddemejorarresultadossintenerpreferenciasexplícitas.

4.  Feedbackimplícito.1.  Informaciónacercadelítem.2.  Informaciónacercadelusuario.3.  Informaciónacercadelatransacción–contextodedecisión.

›  Introducción

4

1.  Contextodelítem.

2.  Contextodelusuario.

3.  Contextodeladecisión.

›  Informacióndecontexto.

5

1.  Descripcióndecadaproducto.2.  Especificaciones.3.  Características.4.  Pertenenciaagrupos/jerarquías/tipos.

›  Informaciónacercadelosítemes.

6

1.  Género.2.  Edad.3.  Educación.4.  Estadocivil.5.  Númerodehijos.6.  Edadesdeloshijos.7.  País,ciudadderesidencia.8.  Trabajo.

›  Informaciónacercadelosusuarios.

7

1.  Lugar/Actividad.2.  Día/hora.3.  Métododepago.4.  Métododeenvío/entrega.

›  Informaciónacercadelatransacción.

8

AGraph-basedRecommenderSystemforDigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen.(2002).

•  163citasenGoogleScholar(4/11/2015).•  9citasel2015.•  Artículos más antiguos que lo citan (anteriores a 2007), son

muchomáscitadosquelosnuevos,variosconmásde100citas.

AGraph-basedRecommenderSystemforDigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen.(2002).

10

•  RecomendacióndelibrosaclientesdeunalibreríadigitaldeTaiwán.

•  Integracióndetécnicasbasadasencontenidocontécnicasdefiltradocolaborativo.

•  Desarrollodesolucióngeneral,aplicableenotroscontextos.

›  Problemaaresolver.

11

›  ModeloUtilizado

12

Libros

Historial de compras

Clientes

Características:•  Flexible.•  Integrador.•  Modular.

Dosetapas:1.  Creacióndevectoresde

característicasparalibrosyclientes.

2.  Construccióndelgrafo,calculandosimilaridades(aristas).

›  Modelo-Representación

13

Representacióndelibros:•  Generacióndelistasdetérminosmediante

métododeinformaciónmutua.Análisisdeco-ocurrenciadepalabrasyfrases.

Representacióndeclientes:•  Vectordecaracterísticas.

›  Modelo–Representación–Etapa1

14

•  Cálculodesimilaridadentrelibros(basadaen(TF-IDF):

•  Importanciadetérminoenunlibro.

•  Importanciadeltérminoenamboslibros.•  Similaridad(asimétrica)

›  Modelo–Representación–Etapa2

15

›  Modelo–Resultadorepresentación

16

Libros

Historial de compras

Clientes

Low-degreeassociation.•  Recomendacióndelibrosmás

similaresalosyacompradosporelcliente(1salto).

High-degreeassociation.•  Recomendaciónutilizandoredde

Hopfield(múltiplessaltos).

›  Recomendaciónenbasealmodelo

17

ReddeHopfield•  Inicialización: 𝑢↓𝑖 (0)=1paralibros

compradosanteriormente.•  Iteración:

•  Criteriodeconvergencia:

›  Recomendaciónenbasealmodelo

18

Hold-out(validacióncruzada).•  100clientes,escogidos

aleatoriamente.•  Paracadacliente:•  50%comprasmásantiguas,

usadasparatraining.•  50%comprasmásnuevas,

usadasparatesting.

›  Evaluaciónyresultados

19

Evaluacióndeusuariosexpertos•  2ciudadanostaiwanesescon

estudiosdepostgrado.

›  Evaluaciónyresultados

20

AGraph-basedmodelforcontext-awarerecommendationusingimplicitfeedbackdata.

Yao,W.,He,J.,Huang,G.,Cao,J.,&Zhang,Y.

•  Recomendacióncuandosecuentasóloconfeedbackimplícito.•  Contextodelusuario,delítemydeladecisión.•  Frameworkgenéricoderecomendaciónbasadoengrafos.

›  Problemaaresolver.

22

›  ModeloMultiLayerContextGraph(MLCG)

23

1.  ConstruccióndelgrafoMLCG.

2.  Asignacióndepesosdelosenlaces.

3.  Generacióndelrankingpersonalizado(usuario,contexto).

›  Tareas.

24

›  1.ModeloMultiLayerContextGraph(MLCG)

25

Donde:•  j es un nodo •  α es un parámetro. •  𝑛↓𝑐 (𝑗) representa la cantidad de elementos contextuales de j •  𝑁↓𝑠 (𝑗)eselconjuntodenodosdelamismacapadej•  𝑁↓𝑑 (𝑗)eselrestodenodosconectadosconj•  f(j,k)esunafunciónquemidelaimportanciadelarelación.

›  2.1Asignacióndepesosalosenlaces›  dentrodelamismacapa.

26

Donde:•  j es un nodo •  α es un parámetro. •  𝑛↓𝑐 (𝑗) representa la cantidad de elementos contextuales de j •  𝑁↓𝑠 (𝑗)eselconjuntodenodosdelamismacapadej•  𝑁↓𝑑 (𝑗)eselrestodenodosconectadosconj

›  2.2Asignacióndepesosalosenlaces›  entrecapas.

27

Donde:•  M es la matriz de probabilidad de transición. •  µ es el factor de damping (normalmente 0.85). •  desunvector,talque𝑑↓𝑘 = 1/𝑛 ,k=1..n;neselnúmerodenodos.Problema:PageRanknoespersonalizado,nodependedelcontexto.

›  3.CálculodeRanking(PageRank).

28

Donde:•  ueselusuarioalquesedeseahacerlarecomendación.•  𝐶↓𝑑  eselcontextodedecisión.•  λesunparámetrodeajustedelpesodelcontexto&preferencias.•  Φeselconjuntodeítemesqueelusuarioucomprópreviamente.

›  Context-awarePersonalizedRandomWalk›  (CPRW)

29

›  Context-awarePersonalizedRandomWalk›  (CPRW)

30

¿Condición de parada?

ElPathSemánticorepresentaelprocesodedecisión,permite“dirigirlaenergía”,actúacomorestriccióndeloscaminosaleatorios.Ejemplos:Búsquedadelusuario:U–D–I- 𝐶↓𝐼   -IÍtemesenpromoción:I- 𝐶↓𝐼  -I-D-U

›  SemanticPath-BasedRandomWalk›  (SPRW)

31

Matrices de transición de cada paso del Path Semántico

•  Datasets:Last.fmyCiteULike•  Métricasutilizadas:•  HitRatio@K•  MeanReciprocalRank(MRR@K)•  Recall@K

•  Métodoscontralosquesecompararonresultados:•  FreMax:Popularidad.•  UserCF:FiltradoColaborativoUB.•  ItemRank:RandomWalksobregrafodeítemes.•  GFREC:Métodobasadoengrafobipartito,similaralpresentadoalinicio.•  PageRank-M(PR-M):AlgoritmooriginaldePageRank.

›  Evaluación

32

›  Evaluación–HitRatio@K

33

›  Evaluación–MRR@K

34

›  Evaluación–Recall@K

35

CONCLUSIONESYCOMENTARIOS

•  Primer modelo presentado (2 capas) intenta ser general, pero fueprobadosóloenuncontextoespecífico(bibliotecavirtualdeTaiwán).

•  Segundomodeloincorporaexplícitamenteelcontextodeladecisión.

•  ModeloSPRW (Semantic Path-BasedRandomWalk) se vepromisorio,por las posibilidades de ajustarlo al problema y por los resultadosobtenidos,noobstantenoseanalizasuescalabilidad.

•  Aun cuando el segundo artículo entrega parámetros utilizados en laspruebas,nodadirectricesrespectodecómofijarlosnihaceunanálisisdesensibilidaddeéstos.

•  Ambos artículos tienenerroresmenoresen fórmulas y algoritmos, quedificultansucomprensión.

37

MUCHASGRACIAS!