|
||
---|---|---|
data | ||
src | ||
.gitignore | ||
prepare_app.py | ||
readme.md | ||
requirements.txt |
🎥 Filmosfera 🎥
System rekomendacyjny filmów dla opisu wyrażonego językiem naturalnym
🚀 Jak uruchomić? 🚀
Wymagania przed uruchomieniem:
-
Python: <= 3.12.x
-
Wirtualne środowisko Python:
Upewnij się, że wirtualne środowisko jest utworzone i aktywowane, aby zapewnić zgodność dodatkowych bibliotek.
Z aktywowanego środowiska uruchom:
pip install -r requirements.txt -
Następnie uruchom skrypt
prepare_app.py
, aby pobrać wymaganego do działania projektu LLM'a.
Uruchamianie Filmosfery w celu podpowiedzi filmowych:
- W katalogu głównym projektu wywołaj komendę:
python src/app/main.py - Poczekaj na uruchomienie się serwera.
- Otwórz stronę internetową w przeglądarce, korzystając z adresu podanego w terminalu (domyślnie: http://127.0.0.1:5000).
🛠️ Samodzielne zdobycie oraz przygotowanie danych 🛠️
Zdobycie danych:
Aby uruchomić część projektu związaną ze zdobyciem danych (folder /src/data_scrapper
):
💡 Proces trwa około 10 godzin ze względu na ostrożne podejście do rate limitów serwisu IMDB. 💡
Wymagania:
- VPN: Ustaw na kraj anglojęzyczny, aby:
- IMDB automatycznie nie tłumaczył niektórych części stron.
- Zapewnić wyświetlanie anglojęzycznych plakatów filmowych (polskie IP wyświetla polskie plakaty).
Kroki:
-
Uruchom z katalogu głównego skrypt
scrapper.py
z/src/data_scrapper
, aby utworzyć bazę filmową Filmosfery:
python src/data_scrapper/scrapper.py -
Uruchom z katalogu głównego skrypt
get_images
z foldeu/src/data_scrapper
, aby:- Pobrać plakaty filmów.
- Zaktualizować bazę filmową, aby zawierała pobrane plakaty:
python src/data_scrapper/get_images.py
Preprocessing danych (folder /src/process_data
):
- Uruchom kolejno z katalogu głównego znajdujące się w folderze :
/src/process_data
następujące skrypty:- python preprocess_data.py
- python make_actors_set.py
- python make_directors_set.py
- python make_genres_set.py
Po zakończeniu, dane są gotowe do wykorzystania w Filmosferze.