Բովանդակություն:

Ինչու՞ առաջինը թողնել կեղծիքներ:
Ինչու՞ առաջինը թողնել կեղծիքներ:
Anonim

1 Պատասխան. drop_first=True-ը կարևոր է օգտագործել, քանի որ այն օգնում է կրճատել կեղծ փոփոխականի ստեղծման ժամանակ ստեղծված հավելյալ սյունակը: Հետևաբար այն նվազեցնում է կեղծ փոփոխականների միջև ստեղծված հարաբերակցությունը:

Ինչու՞ ենք մենք առաջինը ընկնում ստեղնաշարի մեջ:

Ձեր առաջին կատեգորիայի փոփոխականը բաց թողնելը հնարավոր է քանի որ եթե յուրաքանչյուր այլ կեղծ սյունակ է 0, ապա սա նշանակում է, որ ձեր առաջին արժեքը կլիներ 1: Այն, ինչ հեռացնում եք ավելորդության դեպքում, դուք ստանում եք շփոթություն.

Ի՞նչ են անում PD-ն կեղծիքները:

get_dummies օգտագործվում է տվյալների մանիպուլյացիայի համար: Այն փոխակերպում է կատեգորիկ տվյալները կեղծ կամ ցուցիչի փոփոխականների:

Ինչու ենք մենք օգտագործում Get_dummies Python-ում:

get_dummies ֆունկցիան օգտագործվում է կատեգորիկ փոփոխականը կեղծ/ցուցանիշ փոփոխականների փոխարկելու համար: Տվյալներ, որոնցից կարելի է ստանալ կեղծ ցուցիչներ: Տող՝ DataFrame սյունակների անունները ավելացնելու համար։

Ո՞րն է տարբերությունը OneHotEncoder-ի և Get_dummies-ի միջև:

OneHotEncoder-ը sklearn նախնական մշակման ֆունկցիա է: Ի տարբերություն get_dummies, OHE չի ավելացնում փոփոխականներ ձեր տվյալների շրջանակում Այն ստեղծում է կեղծ փոփոխականներ՝ փոխակերպելով X-ը, և բոլոր կեղծիքները պահվում են X-ում: Եվ դուք կարող եք նշել, թե որ սյունակներն եք ցանկանում ստեղծել կեղծիքներ: երբ դուք համապատասխանում եք X-ին OHE-ով։

Խորհուրդ ենք տալիս: