GitHub

Mini Movie DB

Datasets

Use data_collection.sh to download and extract into following directory structure.

data
|-- imdb/*.tsv
|-- ml-25/*.csv
\-- misc/*.csv

IMDb non-commericial datasets
MovieLens
plots.csv generated using cinemagoer (by another team member, but similar to get_plot.py)
user_events.csv (not uploaded) (generated by another team member)

Cleanup and restructure

Use data_preparation.py to process tsv/csv into csv/json for MongoDB import. See collections.txt for schema. Takes around 30 minutes.

`mongoimport`

The previous step will create files: collections/$collection.{csv,json}. Run:

sh import_collection_from_file.sh collections/people.json --drop
sh import_collection_from_file.sh collections/user_events.csv --drop
sh import_collection_from_file.sh collections/user_ratings.csv --drop
sh import_collection_from_file.sh collections/shows.csv --drop
sh import_collection_from_file.sh collections/shows.json --mode=merge
sh import_collection_from_file.sh collections/shows.actors.json --mode=merge
sh import_collection_from_file.sh collections/shows.crew.json --mode=merge

Takes around 30 minutes

Queries

See natural_language_queries.txt for list of queries. Run mongosh < queries.js > queries_out.txt.

FrontEnd

Written using FastAPI and some javascript. See img/ for screenshots.

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
app		app
data/misc		data/misc
img		img
.gitignore		.gitignore
Readme.md		Readme.md
collections.txt		collections.txt
data_collection.sh		data_collection.sh
data_preparation.py		data_preparation.py
get_plot.py		get_plot.py
import_collection_from_file.sh		import_collection_from_file.sh
natural_language_queries.txt		natural_language_queries.txt
queries.js		queries.js
queries_out.txt		queries_out.txt
requirements.txt		requirements.txt
run.sh		run.sh
use_cases.txt		use_cases.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mini Movie DB

Datasets

Cleanup and restructure

`mongoimport`

Queries

FrontEnd

About

Releases

Packages

Languages

recurze/MiniMovieDB

Folders and files

Latest commit

History

Repository files navigation

Mini Movie DB

Datasets

Cleanup and restructure

mongoimport

Queries

FrontEnd

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

`mongoimport`

Packages