Transcript

Estudiante:JuanPabloSalazarFernández

Profesor:Dr.DenisParraSantander

Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ciencia de la Computación

PRESENTACIÓNCURSOSISTEMASRECOMENDADORES

SISTEMASRECOMENDADORES

BASADOSENGRAFOS

05denoviembrede2015

1.  A Graph-based Recommender System for DigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen. InProceedings of the 2ndACM/IEEE-CS joint conference onDigital libraries (JCDL'02).ACM,NewYork,NY,USA,65-73.

2.  A Graph-based mode l f o r con tex t-awarerecommendation using implicit feedback data. Yao,W.,He,J.,Huang,G.,Cao,J.,&Zhang,Y.WorldWideWeb(2015)18:1351–1371

›  Artículosincluidos

2

1.   Introducción.2.   Incorporacióndeinformacióndecontexto.3.   SolucióndeHuanget.al.(2002)•  Problemaaresolver.•  Modeloutilizado.•  Evaluaciónyresultados.

4.   SolucióndeYaoet.al.(2015)•  Problemaaresolver.•  ModeloMulti-LayerContextGraph(MLCG)•  Evaluaciónyresultados.

5.   Conclusionesycomentarios.

›  Agenda

3

1.  Aporteaproblemade“informationoverload”.

2.  Feedbackexplícito,matricesusuario-itemrelativamentedensas.

3.  Necesidaddemejorarresultadossintenerpreferenciasexplícitas.

4.  Feedbackimplícito.1.  Informaciónacercadelítem.2.  Informaciónacercadelusuario.3.  Informaciónacercadelatransacción–contextodedecisión.

›  Introducción

4

1.  Contextodelítem.

2.  Contextodelusuario.

3.  Contextodeladecisión.

›  Informacióndecontexto.

5

1.  Descripcióndecadaproducto.2.  Especificaciones.3.  Características.4.  Pertenenciaagrupos/jerarquías/tipos.

›  Informaciónacercadelosítemes.

6

1.  Género.2.  Edad.3.  Educación.4.  Estadocivil.5.  Númerodehijos.6.  Edadesdeloshijos.7.  País,ciudadderesidencia.8.  Trabajo.

›  Informaciónacercadelosusuarios.

7

1.  Lugar/Actividad.2.  Día/hora.3.  Métododepago.4.  Métododeenvío/entrega.

›  Informaciónacercadelatransacción.

8

AGraph-basedRecommenderSystemforDigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen.(2002).

•  163citasenGoogleScholar(4/11/2015).•  9citasel2015.•  Artículos más antiguos que lo citan (anteriores a 2007), son

muchomáscitadosquelosnuevos,variosconmásde100citas.

AGraph-basedRecommenderSystemforDigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen.(2002).

10

•  RecomendacióndelibrosaclientesdeunalibreríadigitaldeTaiwán.

•  Integracióndetécnicasbasadasencontenidocontécnicasdefiltradocolaborativo.

•  Desarrollodesolucióngeneral,aplicableenotroscontextos.

›  Problemaaresolver.

11

›  ModeloUtilizado

12

Libros

Historial de compras

Clientes

Características:•  Flexible.•  Integrador.•  Modular.

Dosetapas:1.  Creacióndevectoresde

característicasparalibrosyclientes.

2.  Construccióndelgrafo,calculandosimilaridades(aristas).

›  Modelo-Representación

13

Representacióndelibros:•  Generacióndelistasdetérminosmediante

métododeinformaciónmutua.Análisisdeco-ocurrenciadepalabrasyfrases.

Representacióndeclientes:•  Vectordecaracterísticas.

›  Modelo–Representación–Etapa1

14

•  Cálculodesimilaridadentrelibros(basadaen(TF-IDF):

•  Importanciadetérminoenunlibro.

•  Importanciadeltérminoenamboslibros.•  Similaridad(asimétrica)

›  Modelo–Representación–Etapa2

15

›  Modelo–Resultadorepresentación

16

Libros

Historial de compras

Clientes

Low-degreeassociation.•  Recomendacióndelibrosmás

similaresalosyacompradosporelcliente(1salto).

High-degreeassociation.•  Recomendaciónutilizandoredde

Hopfield(múltiplessaltos).

›  Recomendaciónenbasealmodelo

17

ReddeHopfield•  Inicialización: 𝑢↓𝑖 (0)=1paralibros

compradosanteriormente.•  Iteración:

•  Criteriodeconvergencia:

›  Recomendaciónenbasealmodelo

18

Hold-out(validacióncruzada).•  100clientes,escogidos

aleatoriamente.•  Paracadacliente:•  50%comprasmásantiguas,

usadasparatraining.•  50%comprasmásnuevas,

usadasparatesting.

›  Evaluaciónyresultados

19

Evaluacióndeusuariosexpertos•  2ciudadanostaiwanesescon

estudiosdepostgrado.

›  Evaluaciónyresultados

20

AGraph-basedmodelforcontext-awarerecommendationusingimplicitfeedbackdata.

Yao,W.,He,J.,Huang,G.,Cao,J.,&Zhang,Y.

•  Recomendacióncuandosecuentasóloconfeedbackimplícito.•  Contextodelusuario,delítemydeladecisión.•  Frameworkgenéricoderecomendaciónbasadoengrafos.

›  Problemaaresolver.

22

›  ModeloMultiLayerContextGraph(MLCG)

23

1.  ConstruccióndelgrafoMLCG.

2.  Asignacióndepesosdelosenlaces.

3.  Generacióndelrankingpersonalizado(usuario,contexto).

›  Tareas.

24

›  1.ModeloMultiLayerContextGraph(MLCG)

25

Donde:•  j es un nodo •  α es un parámetro. •  𝑛↓𝑐 (𝑗) representa la cantidad de elementos contextuales de j •  𝑁↓𝑠 (𝑗)eselconjuntodenodosdelamismacapadej•  𝑁↓𝑑 (𝑗)eselrestodenodosconectadosconj•  f(j,k)esunafunciónquemidelaimportanciadelarelación.

›  2.1Asignacióndepesosalosenlaces›  dentrodelamismacapa.

26

Donde:•  j es un nodo •  α es un parámetro. •  𝑛↓𝑐 (𝑗) representa la cantidad de elementos contextuales de j •  𝑁↓𝑠 (𝑗)eselconjuntodenodosdelamismacapadej•  𝑁↓𝑑 (𝑗)eselrestodenodosconectadosconj

›  2.2Asignacióndepesosalosenlaces›  entrecapas.

27

Donde:•  M es la matriz de probabilidad de transición. •  µ es el factor de damping (normalmente 0.85). •  desunvector,talque𝑑↓𝑘 = 1/𝑛 ,k=1..n;neselnúmerodenodos.Problema:PageRanknoespersonalizado,nodependedelcontexto.

›  3.CálculodeRanking(PageRank).

28

Donde:•  ueselusuarioalquesedeseahacerlarecomendación.•  𝐶↓𝑑  eselcontextodedecisión.•  λesunparámetrodeajustedelpesodelcontexto&preferencias.•  Φeselconjuntodeítemesqueelusuarioucomprópreviamente.

›  Context-awarePersonalizedRandomWalk›  (CPRW)

29

›  Context-awarePersonalizedRandomWalk›  (CPRW)

30

¿Condición de parada?

ElPathSemánticorepresentaelprocesodedecisión,permite“dirigirlaenergía”,actúacomorestriccióndeloscaminosaleatorios.Ejemplos:Búsquedadelusuario:U–D–I- 𝐶↓𝐼   -IÍtemesenpromoción:I- 𝐶↓𝐼  -I-D-U

›  SemanticPath-BasedRandomWalk›  (SPRW)

31

Matrices de transición de cada paso del Path Semántico

•  Datasets:Last.fmyCiteULike•  Métricasutilizadas:•  HitRatio@K•  MeanReciprocalRank(MRR@K)•  Recall@K

•  Métodoscontralosquesecompararonresultados:•  FreMax:Popularidad.•  UserCF:FiltradoColaborativoUB.•  ItemRank:RandomWalksobregrafodeítemes.•  GFREC:Métodobasadoengrafobipartito,similaralpresentadoalinicio.•  PageRank-M(PR-M):AlgoritmooriginaldePageRank.

›  Evaluación

32

›  Evaluación–HitRatio@K

33

›  Evaluación–MRR@K

34

›  Evaluación–Recall@K

35

CONCLUSIONESYCOMENTARIOS

•  Primer modelo presentado (2 capas) intenta ser general, pero fueprobadosóloenuncontextoespecífico(bibliotecavirtualdeTaiwán).

•  Segundomodeloincorporaexplícitamenteelcontextodeladecisión.

•  ModeloSPRW (Semantic Path-BasedRandomWalk) se vepromisorio,por las posibilidades de ajustarlo al problema y por los resultadosobtenidos,noobstantenoseanalizasuescalabilidad.

•  Aun cuando el segundo artículo entrega parámetros utilizados en laspruebas,nodadirectricesrespectodecómofijarlosnihaceunanálisisdesensibilidaddeéstos.

•  Ambos artículos tienenerroresmenoresen fórmulas y algoritmos, quedificultansucomprensión.

37

MUCHASGRACIAS!


Top Related