Go to file
2025-01-14 15:51:44 +01:00
data added cpu generated embedding for alibaba model 2025-01-11 20:40:48 +01:00
src fixed bug caused by empty user input, added full names of models and Alibaba recommended 2025-01-14 15:49:37 +01:00
.gitignore -Added scrapper for interests -Added scrapper for movies links for interests -generated whole data for interests (genre,subgenres names and links), example of movies links for action subgenre -added config.py for whole scrapping purpouses -modified .gitignore to ignore __pycache__ folders 2024-12-23 00:19:02 +01:00
prepare_app.py -updated readme -added function prepare_app.py 2025-01-12 15:58:36 +01:00
readme.md -piplup forgot about readme.md 2025-01-14 11:49:45 +01:00
requirements.txt -Changed torch version to cpu only 2025-01-12 15:44:09 +01:00

🎥 Filmosfera 🎥

System rekomendacyjny filmów dla opisu wyrażonego językiem naturalnym


🚀 Jak uruchomić? 🚀

Wymagania przed uruchomieniem:

  • Python: <= 3.12.x

  • Wirtualne środowisko Python:
    Upewnij się, że wirtualne środowisko jest utworzone i aktywowane, aby zapewnić zgodność dodatkowych bibliotek.
    Z aktywowanego środowiska uruchom:
    pip install -r requirements.txt

  • Następnie uruchom skrypt prepare_app.py, aby pobrać wymaganego do działania projektu LLM'a.

Uruchamianie Filmosfery w celu podpowiedzi filmowych:

  1. W katalogu głównym projektu wywołaj komendę:
    python src/app/main.py
  2. Poczekaj na uruchomienie się serwera.
  3. Otwórz stronę internetową w przeglądarce, korzystając z adresu podanego w terminalu (domyślnie: http://127.0.0.1:5000).

🛠️ Samodzielne zdobycie oraz przygotowanie danych 🛠️

Zdobycie danych:

Aby uruchomić część projektu związaną ze zdobyciem danych (folder /src/data_scrapper):
💡 Proces trwa około 10 godzin ze względu na ostrożne podejście do rate limitów serwisu IMDB. 💡

Wymagania:

  • VPN: Ustaw na kraj anglojęzyczny, aby:
    • IMDB automatycznie nie tłumaczył niektórych części stron.
    • Zapewnić wyświetlanie anglojęzycznych plakatów filmowych (polskie IP wyświetla polskie plakaty).

Kroki:

  1. Uruchom z katalogu głównego skrypt scrapper.py z /src/data_scrapper , aby utworzyć bazę filmową Filmosfery:
    python src/data_scrapper/scrapper.py

  2. Uruchom z katalogu głównego skrypt get_images z foldeu /src/data_scrapper, aby:

    • Pobrać plakaty filmów.
    • Zaktualizować bazę filmową, aby zawierała pobrane plakaty:
      python src/data_scrapper/get_images.py

Preprocessing danych (folder /src/process_data):

  1. Uruchom kolejno z katalogu głównego znajdujące się w folderze : /src/process_data następujące skrypty:
    • python preprocess_data.py
    • python make_actors_set.py
    • python make_directors_set.py
    • python make_genres_set.py

Po zakończeniu, dane są gotowe do wykorzystania w Filmosferze.