📣 Big news: LightlyStudio is now live! Try it for free.

A-Z of Machine Learning and Computer Vision Terms

Artificial Intelligence (AI)

Binary Classification

Canonical Correlation Analysis (CCA)

Case-Based Reasoning

Chain of Thought (CoT)

ChatGPT

Chi-Squared Automatic Interaction Detection (CHAID)

Class Boundary (Statistics & Machine Learning)

Class Imbalance

Clustering

COCO

Collaborative Filtering

Computer Vision

Computer Vision Model

Concept Drift

Conditional Random Field (CRF)

Confusion Matrix

Constrained Clustering

Contrastive Learning

Convolutional Neural Network (CNN)

Deep Reinforcement Learning (DRL)

DICOM

Dimensionality Reduction

Dropout

Dynamic and Event-Based Classifications

Expectation-Maximization Algorithm (EM)

Extreme Learning Machine

Fisher’s Linear Discriminant

Foundation Models

FP-Growth Algorithm

Frame Rate

Frames Per Second (FPS)

Fully Connected Layer

Fuzzy Logic

Generative Adversarial Network (GAN)

Generative Adversarial Networks

Data Quality

Data quality refers to the condition of a dataset with respect to factors such as accuracy, completeness, consistency, timeliness, and validity. High-quality data correctly represents the real-world construct it is intended to model and is fit for its intended use in decision-making or model training. In ML, poor data quality (e.g., mislabelled samples, noise, bias) can degrade model performance more than poor algorithm choice. Ensuring data quality may involve processes like validation rules (to catch out-of-range or illogical values), data cleaning, deduplication, and periodic audits. When combining datasets, maintaining consistent formats and definitions (data integrity) is key. Overall, trustworthy analytics and AI systems begin with high-quality, reliable data.