یکی از چالشهای دیتابیسهای رابطهایی، ذخیرهسازی دادههایی با ساختار داینامیک است. در حالت عادی، یک جدول مجموعهایی از موجودیتها است. هر موجودیت نیز شامل یکسری ویژگیهای (Attributes) مشخص میباشد. اما شرایطی را در نظر بگیرید که تعداد این ویژگیها به صورت مشخص و ثابتی نباشد؛ یعنی برای هر موجودیت، ویژگیهای متفاوتی داشته باشیم. یک روش پیادهسازی اینچنین سناریوهایی، استفاده از مدلی با نام Entity Attribute Value است. در این روش ستونهای داینامیک را درون یک جدول جنریک تعریف خواهیم کرد. به عنوان مثال برای ذخیرهسازی اطلاعات اشخاص، در حالت نرمال، یک جدول با ساختار مشخصی خواهیم داشت:
کوئری LINQ کد فوق اینچنین شکلی خواهد داشت:
اما در مدل EAV نوشتن کوئری فوق خیلی سختتر خواهد بود:
همچنین کوئری LINQ آن نیز به همان اندازه سخت میباشد:
create table Employees ( Id int auto_increment primary key, FirstName text null, LastName text null, DateOfBirth timestamp not null );
تعریف جدول فوق نیز در Entity Framework به اینصورت خواهد بود:
public class Employee { public int Id { get; set; } public string FirstName { get; set; } public string LastName { get; set; } public DateTimeOffset DateOfBirth { get; set; } } public class MyDbContext : DbContext { public DbSet<Employee> Employees { get; set; } protected override void OnConfiguring(DbContextOptionsBuilder options) { options.UseMySQL(_configuration.GetConnectionString("DataConnection")); } }
اما در مدل EAV، خواص داینامیک را به درون جدول دومی منتقل خواهیم کرد:
create table EmployeeEav ( Id int auto_increment primary key ); create table EmployeeAttributes ( Id int auto_increment primary key, EmployeeId int not null, AttributeName text null, AttributeValue text null, constraint FK_EmployeeAttributes_EmployeeEav_EmployeeId foreign key (EmployeeId) references EmployeeEav (Id) on delete cascade ); create index IX_EmployeeAttributes_EmployeeId on EmployeeAttributes (EmployeeId);
تعریف جداول فوق نیز در Entity Framework به اینصورت خواهند بود:
public class EmployeeEav { public int Id { get; set; } public virtual ICollection<EmployeeAttribute> Attributes { get; set; } } public class EmployeeAttribute { public int Id { get; set; } public virtual EmployeeEav Employee { get; set; } public int EmployeeId { get; set; } public string AttributeName { get; set; } public string AttributeValue { get; set; } } public class MyDbContext : DbContext { public DbSet<EmployeeEav> EmployeeEav { get; set; } public DbSet<EmployeeAttribute> EmployeeAttributes { get; set; } protected override void OnConfiguring(DbContextOptionsBuilder options) { options.UseMySQL(_configuration.GetConnectionString("DataConnection")); } }
درون این جدول دوم، سه فیلد اصلی داریم: یکی به عنوان Entity که در اینجا یک ارجاع را به جدول EmployeeEav دارد. یک فیلد به عنوان Attribute که برای تعیین نام ویژگی داینامیک استفاده میشود و در نهایت یک Value که برای ذخیرهسازی مقدار ویژگی مورد استفاده قرار میگیرد. بنابراین به این نوع طراحی، Entity Attribute Value گفته میشود. مزیت اصلی این روش، انعطاف زیاد آن است در واقع میتوانیم N تعداد ویژگی را برای Entity موردنظرمان داشته باشیم. اما این روش یک SQL Smell است و اشکالات زیادی را به همراه دارد:
- کوئری گرفتن در این روش سخت است
یکی از مشکلات اصلی این روش این است امکان کوئری گرفتن از جدول ویژگیها را سخت میکند. در واقع این روش به store everything, query nothing معروف است. مثلاً فرض کنید میخواهیم لیست کارمندانی را که تاریخ تولدشان ۲۵ سال پیش است، واکشی کنیم. در حالت عادی با تعداد ستون ثابت میتوانیم به راحتی اینکار را انجام دهیم:
SELECT `e`.`Id`, `e`.`DateOfBirth`, `e`.`FirstName`, `e`.`LastName` FROM `Employees` AS `e` WHERE `e`.`DateOfBirth` > @__endDate_0
var endDate = DateTimeOffset.Now.AddYears(Convert.ToInt32(-25)); var normalTypes = dbContext.Employees.Where(x => x.DateOfBirth > endDate).ToList();
SELECT MAX(CASE AttributeName WHEN 'FirstName' THEN AttributeValue END) AS FirstName, MAX(CASE AttributeName WHEN 'LastName' THEN AttributeValue END) AS LastName, MAX(CASE AttributeName WHEN 'DateOfBirth' THEN AttributeValue END) AS DateOfBirth FROM efcoresample.EmployeeAttributes WHERE EmployeeId IN (SELECT EmployeeId FROM efcoresample.EmployeeAttributes WHERE AttributeName = 'DateOfBirth' AND AttributeValue > DATE_SUB(CURRENT_DATE(), INTERVAL 25 YEAR)) AND AttributeName IN ('FirstName', 'LastName', 'DateOfBirth') GROUP BY EmployeeId;
string[] columnNames = {"FirstName", "LastName", "DateOfBirth"}; var employees = dbContext.EmployeeAttributes .Where(x => dbContext.EmployeeAttributes .Where(i => i.AttributeName == "DateOfBirth") .Select(eId => eId.EmployeeId).Contains(x.EmployeeId) && columnNames.Contains(x.AttributeName)) .GroupBy(x => x.EmployeeId) .Select(g => new { FirstName = g.Max(f => f.AttributeName == "FirstName" ? f.AttributeValue : ""), LastName = g.Max(f => f.AttributeName == "LastName"? f.AttributeValue : ""), DateOfBirth = g.Max(f => f.AttributeName == "DateOfBirth"? f.AttributeValue : ""), Id = g.Key }) .ToList() .Where(x => DateTime.ParseExact(x.DateOfBirth, "yyyy-MM-dd", CultureInfo.InvariantCulture) > DateTime.Now.AddYears(-25));
- امکان تعریف فیلدهای اجباری را نخواهیم داشت
در حالت نرمال و ساختاریافته، برای هرکدام از فیلدها میتوانیم الزامی و یا اختیاری بودن آنها را به راحتی با NOT NULL تعیین کنیم. اما در مدل EAV این امکان را نخواهیم داشت.
- امکان تعیین نوع ستونها را نخواهیم داشت
در حالت نرمال به راحتی میتوانیم نوع فیلد موردنظر را تعیین کنیم. اما در مدل EAV به دلیل ماهیت داینامیک ستونها، این امکان را نداریم. ستون AttributeValue همزمان ممکن است تاریخ، عددی، اعشاری و… باشد در نتیجه چون از ورودی مطمئن نیستیم، مجبوریم تایپ آن را به رشته تنظیم کنیم.
- امکان تعریف کلیدهای خارجی را نخواهیم داشت
در مدل EAV نمیتوانیم صحت دیتا را تضمین کنیم؛ زیرا امکان تعریف کلید خارجی را نخواهیم داشت.
بنابراین بهتر است تا حد امکان از مدل EAV استفاده نشود؛ مگر اینکه در شرایطی خاص، مجبور به استفادهی از آن باشید. به عنوان مثال برنامهی شما قرار است قابلیت ایمپورت هر نوع فایل CSV را داشته باشد. هر فایل هم ممکن است به تعداد نامشخصی، یکسری ستون را داشته باشد. در این شرایط میتوانید با در نظر گرفتن موارد فوق، از مدل مطرح شده استفاده کنید.