You are viewing a single comment's thread from:

RE: Categorizzazione dei testi: LSA e Clustering

in #scienze6 years ago

Ci sta un errore che farebbe svenire svariati miei professori: non si può parlare di correlazione quando si parla di frequenze. Si parla di connessione. La correlazione si usa per le modalità numeriche. Come fai a calcolare la covarianza e varianze di due parole?

Gli algoritmi di Clustering utilizzano la funzione di distanza o correlazione tra punti per poterli riunire in due o più insiemi congrui tra di loro.

Come fai a fare la correlazione fra punti? Gli algoritmi di clustering, da quanto ne so, si basano per lo più sulla distanza euclidea. Ossia di norma euclidea, dell'algebra lineare, cantata con parole diverse.

Noto un abuso della parola correlazione che mi fa pensare ad una influenza di carattere informatico e di cultura americana.

Sort:  

Quando scrivo "correlazione" intendo la relazione tra una parola e l'altra dal punto di vista semantico. Io non sono un matematico quindi mi spiace se ho utilizzato termini a sproposito, ma la terrei perché secondo me due termini che afferiscono allo stesso "tema" sono in qualche maniera connessi tra loro (non da un punto di vista statistico ovviamente).

Per gli algoritmi di clustering stessa cosa, ma effettivamente all'interno della frase "generica" non ha molto senso, lo tolgo ;)

Coin Marketplace

STEEM 0.18
TRX 0.14
JST 0.030
BTC 60115.56
ETH 3203.28
USDT 1.00
SBD 2.46