K nearest neighbours with mutual information for simultaneous classification and missing data imputation

Garcia-Laencina, Pedro J.; Sancho-Gomez, Jose-Luis; Figueiras-Vidal, Anibal R.; Verleysen, Michel

doi:10.1016/j.neucom.2008.11.026

K nearest neighbours with mutual information for simultaneous classification and missing data imputation

Garcia-Laencina, Pedro J.

;

Sancho-Gomez, Jose-Luis

;

Figueiras-Vidal, Anibal R.

;

Verleysen, Michel

(2009) Neurocomputing — Vol. 72, n° 7-9, p. 1483-1493 (2009)

Files

pdfdocument.pdf

Restricted Access
Adobe PDF
574.08 KB

Request a copy

Details

Authors

Garcia-Laencina, Pedro J.
Author
Sancho-Gomez, Jose-Luis
Author
Figueiras-Vidal, Anibal R.
Author
Verleysen, MichelUCLouvain
Author

Abstract

Missing data is a common drawback in many real-life pattern classification scenarios. One of the most popular solutions is missing data imputation by the K nearest neighbours (KNN) algorithm. In this article, we propose a novel KNN imputation procedure using a feature-weighted distance metric based on mutual information (MI). This method provides a missing data estimation aimed at solving the classification task, i.e., it provides an imputed dataset which is directed toward improving the classification performance. The MI-based distance metric is also used to implement an effective KNN classifier. Experimental results on both artificial and real classification datasets are provided to illustrate the efficiency and the robustness of the proposed algorithm. (C) 2009 Elsevier B.V. All rights reserved.

Affiliations

UCLouvainFSA/ELEC - Département d'électricité

Citations

APA
Chicago
FWB

Garcia-Laencina, P. J., Sancho-Gomez, J.-L., Figueiras-Vidal, A. R., & Verleysen, M. (2009). K nearest neighbours with mutual information for simultaneous classification and missing data imputation. Neurocomputing, 72(7-9), 1483-1493. https://doi.org/10.1016/j.neucom.2008.11.026 (Original work published 2009)