Go to file
2025-04-03 17:45:17 +02:00
data added cpu generated embedding for alibaba model 2025-01-11 20:40:48 +01:00
images -Added pictures to readme file 2025-04-03 17:43:32 +02:00
src -Fixed typo in a word 'scraper' 2025-04-03 17:26:05 +02:00
.gitignore -Added scrapper for interests -Added scrapper for movies links for interests -generated whole data for interests (genre,subgenres names and links), example of movies links for action subgenre -added config.py for whole scrapping purpouses -modified .gitignore to ignore __pycache__ folders 2024-12-23 00:19:02 +01:00
prepare_app.py -updated readme -added function prepare_app.py 2025-01-12 15:58:36 +01:00
readme.md Final touch to readme.md 2025-04-03 17:44:49 +02:00
requirements.txt -Changed torch version to cpu only 2025-01-12 15:44:09 +01:00

🎥 Filmosfera 🎥

System rekomendacyjny filmów dla opisu wyrażonego językiem naturalnym


📷 Zdjęcia 📷

MainPage Results1 Results2 Results3 Results4 Results5

🚀 Jak uruchomić? 🚀

Wymagania przed uruchomieniem:

  • Python: <= 3.12.x

  • Wirtualne środowisko Python:
    Upewnij się, że wirtualne środowisko jest utworzone i aktywowane, aby zapewnić zgodność dodatkowych bibliotek.
    Z aktywowanego środowiska uruchom:
    pip install -r requirements.txt

  • Następnie uruchom skrypt prepare_app.py, aby pobrać wymaganego do działania projektu LLM'a.

Uruchamianie Filmosfery w celu podpowiedzi filmowych:

  1. W katalogu głównym projektu wywołaj komendę:
    python src/app/main.py
  2. Poczekaj na uruchomienie się serwera.
  3. Otwórz stronę internetową w przeglądarce, korzystając z adresu podanego w terminalu (domyślnie: http://127.0.0.1:5000).

🛠️ Samodzielne zdobycie oraz przygotowanie danych 🛠️

Zdobycie danych:

Aby uruchomić część projektu związaną ze zdobyciem danych (folder /src/data_scraper):
💡 Proces trwa około 10 godzin ze względu na ostrożne podejście do rate limitów serwisu IMDB. 💡

Wymagania:

  • VPN: Ustaw na kraj anglojęzyczny, aby:
    • IMDB automatycznie nie tłumaczył niektórych części stron.
    • Zapewnić wyświetlanie anglojęzycznych plakatów filmowych (polskie IP wyświetla polskie plakaty).

Kroki:

  1. Uruchom z katalogu głównego skrypt scraper.py z /src/data_scraper , aby utworzyć bazę filmową Filmosfery:
    python src/data_scraper/scraper.py

  2. Uruchom z katalogu głównego skrypt get_images z foldeu /src/data_scraper, aby:

    • Pobrać plakaty filmów.
    • Zaktualizować bazę filmową, aby zawierała pobrane plakaty:
      python src/data_scraper/get_images.py

Preprocessing danych (folder /src/process_data):

  1. Uruchom kolejno z katalogu głównego znajdujące się w folderze : /src/process_data następujące skrypty:
    • python preprocess_data.py
    • python make_actors_set.py
    • python make_directors_set.py
    • python make_genres_set.py

Po zakończeniu, dane są gotowe do wykorzystania w Filmosferze.