recomendación basadaen...

39
Recomendación Basada en Grafos Denis Parra IIC 3633 2016

Upload: others

Post on 06-Aug-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Recomendación Basada enGrafos

DenisParraIIC36332016

Page 2: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

AgendaSemestral

Page 3: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Problema deRecomendación

• Nuevamente revisitamos elproblema derecomendación.

• Una alternativa válida alosmétodos vistoshastaahora es explotar las relaciones entreitemsenlaformadegrafos.

Page 4: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Hoy

• Associativeretrievaltechniquestoalleviatethesparsity probleminCF(Huangetal.2004)

• ThelinkPredictionProblemforSocialNetworks(Liben-Nowel,Kleinberg,2002)

Page 5: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Paper1

• Zan Huang,Hsinchun Chen,andDanielZeng.2004.Applyingassociativeretrievaltechniquestoalleviatethesparsity problemincollaborativefiltering.ACMTrans.Inf.Syst.22,1(January2004),116-142.

Page 6: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Resumen

• Lidiar conelproblema deescasez deevaluaciones delusuario (ratings)

• Filtrado Colaborativo es estudiado como ungrafo bi-partito.

• Técnicas derecuperación asociativa sonutilizadas sobre elgrafo (SpreadingActivation)

• RESULTADO:Cuando hayescasez deratings,estas técnicas basadas engrafos mejoran losresultado delfiltrado colaborativo.

Page 7: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

ElProblema deEscasez (Sparsity)

• Al2004,losproblemas decold-startynew-itemsehabían atacado usando:– Item-BasedCF(Sarwar 2001)– Reducción deDimensionalidad (Golderg 2001)– Híbridos (Balanovic 2002,Basu 1998,Condliff1999,etc.)

• Ninguno delosmétodos mencionados habíatenido consenso absoluto desu éxito

Page 8: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

CFcomo Recuperación Asociativa

• Ideabásica:construir ungrafo entreusuarioseitemsyexplorar asociaciones transitivasentreellos.

Page 9: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

CFcomo Recuperación Asociativa

• Ideabásica:construir ungrafo entreusuarioseitemsyexplorar asociaciones transitivasentreellos.

3hops 3hops 5 hops

Page 10: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Notación Matricial

• Consideremos lamatriz consumidor/productoA

• Parámetros:M:hops,α=decaimiento (pesoasociado alenlace

Page 11: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Ejemplo

• DadoA

• Luego,para M=3,α=0.5

• Luego,para M=5,α=0.5

Page 12: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Dificultades

• Calcular lapotencia deuna matriz puede sermuy costoso paraun“c”yun“n”muygrandes,locual motiva los3métodosprobados por Huangetal.enelpaper.

Page 13: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Supuesto delaInvestigación

• Losmétodos deSpreadingActivationfuncionarán mejor cuando laredtiene muybaja densidad,encaso contrario puede ocurrirsobre-activación.

Page 14: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Modelos

• ConstrainedLeakyCapacitorModel(LCM)• Branch-and-Bound• HopfieldNet

Page 15: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

LCM

• Propuesto por Anderson(1983)

• Pasos:– Identificar nodo-vectorinicial V,setear D(0)– Cálculo denivel deactivación

Donde (1-γ):speedofdecay(0.8),α:efficiency(0.8)– Condición dedetención:enelpaper=10,top50

Page 16: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Branch-and-Bound• Implementación basada en(Chen&Ng1995)• Paso1,Inicialización:Nodo correspondiente alusuario es activado (1),losotros =0.ColaQpriority seinicializa connodo usuario activo.

• Paso2,Cálculo deactivación:Sacar nodos deQpriority,por cada nodo vecino calcular

y agregar/actualizar nodo activado aQoutput

• Paso3,detención:determinada empiricamente (70)

Page 17: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Holpfield Net

• Paralelo conredneuronal.Usuarios eitemssonneuronas.Sinapsis sonlas activaciones.

• Inicialización:igual que las anteriores• Calculo deactivación:

• Condición dedetención:

Page 18: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Estudio Experimental

• Tienda delibros enlinea deChina9,695libros /2,000usuarios /18,771transacciones• Métricas deevaluación:

Precision,Recall,F-1• Yutilityrank

Page 19: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Recordemos hipótesis• H1.Spreadingactivation-basedCFcanachievehigherrecommendationquality thanthe3-hop,User-based(Correlation),User-based(VectorSimilarity),andItem-basedapproaches.

• H2.Spreadingactivation-basedCFcanachievehigherrecommendationqualitythanthe3-hop,User-based(Correlation),User-based(VectorSimilarity),andItem-basedapproachesfornewusers(thecold-startproblem).

• H3.Therecommendationqualityofspreadingactivation-basedCFdecreaseswhenthedensityofuser–iteminteractionsisbeyondacertainlevel(theover-activationeffect).

Page 20: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Resultados

H1:Comparación dealgoritmos bajo condiciones normales

H2:Comparación dealgoritmos conusuarios sparse

Page 21: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Resultados 2

H2:Comparación dealgoritmos enbaseaRecall,conusuarioscold-start

Page 22: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Resultados 3

Page 23: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Resultados 3.2

Page 24: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

ComputationalEfficiency

Page 25: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Lecciones

• H1,H2yH3sedemuestran• Sensibilidad delosparámetros:– LCM:noes muy sensible(alfa,gama eiteraciones)– BNB:diferencia en70y100iteraciones es baja,sobre 100baja drásticamente

– HopfieldNet:poca diferencia entreparámetros

Page 26: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Paper2

• Liben-Nowell,D.,&Kleinberg,J.(2007).Thelink-predictionproblemforsocialnetworks.JournaloftheAmericansocietyforinformationscienceandtechnology,58(7),1019-1031.

Page 27: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

ElProblema

Page 28: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Definiciones

Imagen desde http://be.amazd.com/link-prediction/

Page 29: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Notación para arXiv deFísica

Page 30: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Métricas 1:distancia enelgrafo

Imagen desde http://be.amazd.com/link-prediction/

Page 31: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Vecinos enComún

Imagen desde http://be.amazd.com/link-prediction/

Page 32: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Jaccard

Imagen desde http://be.amazd.com/link-prediction/

Page 33: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Adamic-Adar

Page 34: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

PreferentialAttachment

Imagen desde http://be.amazd.com/link-prediction/

Page 35: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Katz

Page 36: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Espectrales/RandomWalk

• HittingTime

• RootedPageRank

• SimRank

Page 37: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Resultados

Page 38: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Resultados 2

Page 39: Recomendación Basadaen Grafosdparra.sitios.ing.uc.cl/classes/recsys-2016-2/clase15_graphBasedRe… · clase15_graphBasedRecsys Author: Denis Parra Created Date: 10/18/2016 11:54:38

Referencias• Zan Huang,Hsinchun Chen,andDanielZeng.2004.Applyingassociative

retrieval techniques toalleviate thesparsity problem incollaborativefiltering.ACMTrans.Inf.Syst.22,1(January2004),116-142.

• Liben-Nowell,D.,&Kleinberg, J.(2007).Thelink-predictionproblemforsocialnetworks. JournaloftheAmericansocietyforinformationscienceandtechnology,58(7),1019-1031.

• G.Jeh andJ.Widom.SimRank:Ameasureofstructural-context similarity.InProceedings oftheEighthACMSIGKDDInternationalConference onKnowledgeDiscoveryandDataMining,Edmonton,Alberta,Canada,July2002.

• Nguyen,P.,Tomeo,P.,DiNoia,T.,&DiSciascio,E.(2015,May).AnevaluationofSimRank andPersonalizedPageRanktobuildarecommender systemfortheWebofData.InProceedingsofthe24thInternational Conference onWorldWideWebCompanion (pp.1477-1482).InternationalWorldWideWebConferences SteeringCommittee.