3
This commit is contained in:
parent
58d54c38ca
commit
8c34124a9b
@ -437,6 +437,20 @@
|
|||||||
"### IDF"
|
"### IDF"
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
|
{
|
||||||
|
"cell_type": "markdown",
|
||||||
|
"metadata": {},
|
||||||
|
"source": [
|
||||||
|
"Wersja bez żadnej normalizacji\n",
|
||||||
|
"\n",
|
||||||
|
"\n",
|
||||||
|
"$idf_i = \\Large\\frac{|D|}{|\\{d : t_i \\in d \\}|}$\n",
|
||||||
|
"\n",
|
||||||
|
"\n",
|
||||||
|
"$|D|$ - ilość dokumentów w korpusie\n",
|
||||||
|
"$|\\{d : t_i \\in d \\}|$ - ilość dokumentów w korpusie, gdzie dany term występuje chociaż jeden raz"
|
||||||
|
]
|
||||||
|
},
|
||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
"execution_count": 22,
|
"execution_count": 22,
|
||||||
@ -470,7 +484,7 @@
|
|||||||
"outputs": [],
|
"outputs": [],
|
||||||
"source": [
|
"source": [
|
||||||
"for i in range(len(documents_vectorized)):\n",
|
"for i in range(len(documents_vectorized)):\n",
|
||||||
" documents_vectorized[i] = documents_vectorized[i]# * idf"
|
" documents_vectorized[i] = documents_vectorized[i] * idf"
|
||||||
]
|
]
|
||||||
},
|
},
|
||||||
{
|
{
|
||||||
@ -961,7 +975,9 @@
|
|||||||
{
|
{
|
||||||
"cell_type": "code",
|
"cell_type": "code",
|
||||||
"execution_count": 36,
|
"execution_count": 36,
|
||||||
"metadata": {},
|
"metadata": {
|
||||||
|
"scrolled": true
|
||||||
|
},
|
||||||
"outputs": [
|
"outputs": [
|
||||||
{
|
{
|
||||||
"data": {
|
"data": {
|
||||||
@ -1065,18 +1081,7 @@
|
|||||||
{
|
{
|
||||||
"cell_type": "markdown",
|
"cell_type": "markdown",
|
||||||
"metadata": {},
|
"metadata": {},
|
||||||
"source": [
|
"source": []
|
||||||
"### ZADANIE 4 NAPISAĆ IDF w celu zmiany wag z TF na TF- IDF \n",
|
|
||||||
"\n",
|
|
||||||
"Proszę użyć wersję bez żadnej normalizacji\n",
|
|
||||||
"\n",
|
|
||||||
"\n",
|
|
||||||
"$idf_i = \\Large\\frac{|D|}{|\\{d : t_i \\in d \\}|}$\n",
|
|
||||||
"\n",
|
|
||||||
"\n",
|
|
||||||
"$|D|$ - ilość dokumentów w korpusie\n",
|
|
||||||
"$|\\{d : t_i \\in d \\}|$ - ilość dokumentów w korpusie, gdzie dany term występuje chociaż jeden raz"
|
|
||||||
]
|
|
||||||
}
|
}
|
||||||
],
|
],
|
||||||
"metadata": {
|
"metadata": {
|
||||||
|
Loading…
Reference in New Issue
Block a user