recomendación basadaen...

Post on 06-Aug-2020

4 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Recomendación Basada enGrafos

DenisParraIIC36332016

AgendaSemestral

Problema deRecomendación

• Nuevamente revisitamos elproblema derecomendación.

• Una alternativa válida alosmétodos vistoshastaahora es explotar las relaciones entreitemsenlaformadegrafos.

Hoy

• Associativeretrievaltechniquestoalleviatethesparsity probleminCF(Huangetal.2004)

• ThelinkPredictionProblemforSocialNetworks(Liben-Nowel,Kleinberg,2002)

Paper1

• Zan Huang,Hsinchun Chen,andDanielZeng.2004.Applyingassociativeretrievaltechniquestoalleviatethesparsity problemincollaborativefiltering.ACMTrans.Inf.Syst.22,1(January2004),116-142.

Resumen

• Lidiar conelproblema deescasez deevaluaciones delusuario (ratings)

• Filtrado Colaborativo es estudiado como ungrafo bi-partito.

• Técnicas derecuperación asociativa sonutilizadas sobre elgrafo (SpreadingActivation)

• RESULTADO:Cuando hayescasez deratings,estas técnicas basadas engrafos mejoran losresultado delfiltrado colaborativo.

ElProblema deEscasez (Sparsity)

• Al2004,losproblemas decold-startynew-itemsehabían atacado usando:– Item-BasedCF(Sarwar 2001)– Reducción deDimensionalidad (Golderg 2001)– Híbridos (Balanovic 2002,Basu 1998,Condliff1999,etc.)

• Ninguno delosmétodos mencionados habíatenido consenso absoluto desu éxito

CFcomo Recuperación Asociativa

• Ideabásica:construir ungrafo entreusuarioseitemsyexplorar asociaciones transitivasentreellos.

CFcomo Recuperación Asociativa

• Ideabásica:construir ungrafo entreusuarioseitemsyexplorar asociaciones transitivasentreellos.

3hops 3hops 5 hops

Notación Matricial

• Consideremos lamatriz consumidor/productoA

• Parámetros:M:hops,α=decaimiento (pesoasociado alenlace

Ejemplo

• DadoA

• Luego,para M=3,α=0.5

• Luego,para M=5,α=0.5

Dificultades

• Calcular lapotencia deuna matriz puede sermuy costoso paraun“c”yun“n”muygrandes,locual motiva los3métodosprobados por Huangetal.enelpaper.

Supuesto delaInvestigación

• Losmétodos deSpreadingActivationfuncionarán mejor cuando laredtiene muybaja densidad,encaso contrario puede ocurrirsobre-activación.

Modelos

• ConstrainedLeakyCapacitorModel(LCM)• Branch-and-Bound• HopfieldNet

LCM

• Propuesto por Anderson(1983)

• Pasos:– Identificar nodo-vectorinicial V,setear D(0)– Cálculo denivel deactivación

Donde (1-γ):speedofdecay(0.8),α:efficiency(0.8)– Condición dedetención:enelpaper=10,top50

Branch-and-Bound• Implementación basada en(Chen&Ng1995)• Paso1,Inicialización:Nodo correspondiente alusuario es activado (1),losotros =0.ColaQpriority seinicializa connodo usuario activo.

• Paso2,Cálculo deactivación:Sacar nodos deQpriority,por cada nodo vecino calcular

y agregar/actualizar nodo activado aQoutput

• Paso3,detención:determinada empiricamente (70)

Holpfield Net

• Paralelo conredneuronal.Usuarios eitemssonneuronas.Sinapsis sonlas activaciones.

• Inicialización:igual que las anteriores• Calculo deactivación:

• Condición dedetención:

Estudio Experimental

• Tienda delibros enlinea deChina9,695libros /2,000usuarios /18,771transacciones• Métricas deevaluación:

Precision,Recall,F-1• Yutilityrank

Recordemos hipótesis• H1.Spreadingactivation-basedCFcanachievehigherrecommendationquality thanthe3-hop,User-based(Correlation),User-based(VectorSimilarity),andItem-basedapproaches.

• H2.Spreadingactivation-basedCFcanachievehigherrecommendationqualitythanthe3-hop,User-based(Correlation),User-based(VectorSimilarity),andItem-basedapproachesfornewusers(thecold-startproblem).

• H3.Therecommendationqualityofspreadingactivation-basedCFdecreaseswhenthedensityofuser–iteminteractionsisbeyondacertainlevel(theover-activationeffect).

Resultados

H1:Comparación dealgoritmos bajo condiciones normales

H2:Comparación dealgoritmos conusuarios sparse

Resultados 2

H2:Comparación dealgoritmos enbaseaRecall,conusuarioscold-start

Resultados 3

Resultados 3.2

ComputationalEfficiency

Lecciones

• H1,H2yH3sedemuestran• Sensibilidad delosparámetros:– LCM:noes muy sensible(alfa,gama eiteraciones)– BNB:diferencia en70y100iteraciones es baja,sobre 100baja drásticamente

– HopfieldNet:poca diferencia entreparámetros

Paper2

• Liben-Nowell,D.,&Kleinberg,J.(2007).Thelink-predictionproblemforsocialnetworks.JournaloftheAmericansocietyforinformationscienceandtechnology,58(7),1019-1031.

ElProblema

Definiciones

Imagen desde http://be.amazd.com/link-prediction/

Notación para arXiv deFísica

Métricas 1:distancia enelgrafo

Imagen desde http://be.amazd.com/link-prediction/

Vecinos enComún

Imagen desde http://be.amazd.com/link-prediction/

Jaccard

Imagen desde http://be.amazd.com/link-prediction/

Adamic-Adar

PreferentialAttachment

Imagen desde http://be.amazd.com/link-prediction/

Katz

Espectrales/RandomWalk

• HittingTime

• RootedPageRank

• SimRank

Resultados

Resultados 2

Referencias• Zan Huang,Hsinchun Chen,andDanielZeng.2004.Applyingassociative

retrieval techniques toalleviate thesparsity problem incollaborativefiltering.ACMTrans.Inf.Syst.22,1(January2004),116-142.

• Liben-Nowell,D.,&Kleinberg, J.(2007).Thelink-predictionproblemforsocialnetworks. JournaloftheAmericansocietyforinformationscienceandtechnology,58(7),1019-1031.

• G.Jeh andJ.Widom.SimRank:Ameasureofstructural-context similarity.InProceedings oftheEighthACMSIGKDDInternationalConference onKnowledgeDiscoveryandDataMining,Edmonton,Alberta,Canada,July2002.

• Nguyen,P.,Tomeo,P.,DiNoia,T.,&DiSciascio,E.(2015,May).AnevaluationofSimRank andPersonalizedPageRanktobuildarecommender systemfortheWebofData.InProceedingsofthe24thInternational Conference onWorldWideWebCompanion (pp.1477-1482).InternationalWorldWideWebConferences SteeringCommittee.

top related