2.5 KiB
Spacery losowe po grafach: algorytm wyszukiwania klastrów
Spacery losowe
Graf G = (V, E) składa się ze zbioru wierzchołków V oraz zbioru krawędzi E, gdzie E zbiorem nieuporządkowanych par wierzchołków:
$E ⊂\{(x, y) : x, y ∈ V, x ≠ y\} $
Je»eli (x, y) ∈ E, to wierzchołki x, y nazywamy sąsiadami i oznaczamy x ∼ y. Stopniem wierzchołka x ∈ V nazywamy liczbę jego sąsiadów i oznaczamy deg(x). Na danym grafie G = (V, E) definiujemy prosty spacer losowy. Jest to łańcuch Markowa na przestrzeni stanów V z macierzą przejścia
$P(x, y) = \frac{1}{deg(x)}$ jeżeli y ∼ x
$P(x, y) = 0$ w przeciwnym razie
Gdy łańcuch znajduje się w wierzchołku x, to wybiera losowo (jednostajnie) jednego z jego sąsiadów i przechodzi do niego.
Łancuch markova
Proces Markowa – ciąg zdarzeń, w którym prawdopodobieństwo każdego zdarzenia zależy jedynie od wyniku poprzedniego. W ujęciu matematycznym, procesy Markowa to takie procesy stochastyczne, które spełniają własność Markowa.
$P(X_{n+1} = x|X_{n}=x_n,\ldots X_{1}=x_{1}) = P(X_{n+1}=x | X_{n}=x_n)$
Oznacza to, że zmienna w ciągu X n ''pamięta'' tylko swój stan z poprzedniego kroku i wyłącznie od niego zależy.
Podgrafy silnie ze sobą powiązane
Najprościej będzie to zaobserować na przykładzie:
Wierzchołki krytyczne rozspójniające graf
Graf spójny - graf w który dowolne dwa wierzchołki łączy pewna ścieżka
Wierzchołkiem krytycznym powyższego grafu jest wierzchołek numer 4, usunięcie go spowoduje odłączenie wierzchołka numer 6 od reszty grafu