优化
您可以在不使用 Doctrine 的结果缓存的情况下优化您的流程:
首先为他们的 id 创建一张年份地图,如下所示:
$yearsMap = array();
$q = $em->createQuery('SELECT y.id, y.year_name FROM Entities\Year y');
foreach ($q->getScalarResult() as $row) {
$yearsMap[$row['year_name']] = $row['id'];
}
还可以根据他们的 ID 创建部门地图,并根据他们的 ID 创建部门地图。
这将产生 3 个(轻量级)查询。
放置此代码的最佳位置是(自定义)存储库。
接下来你可以运行你的循环,但是像这样“获取”实际的实体:
$year = $this->em->getReference('Entities\Year', $yearsMap[$this->year[$i]]);
$department = $this->em->getReference('Entities\Department', $departmentsMap[$this->branch[$i]]);
$division = $this->em->getReference('Entities\Division', $divisionsMap[$this->division[$i]]);
我说“get”,因为getReference() 实际上创建了一个代理(除非它已经被实体管理器加载,但在这种情况下它可能不是)。该代理尚未加载,因此此处不执行任何查询。
您的其余代码不需要更改。
现在当flush() 被调用时,Doctrine 将只加载每个不同的年份/部门/部门一次。这仍然可能导致一些查询,具体取决于使用了多少不同年/部门/部门。因此,如果所有 100 名学生都使用不同的年级/部门/部门,您最终将得到 403 个查询(3 个用于地图,300 个用于加载代理,100 个用于插入学生)。但是如果所有 100 名学生都使用相同的年级/部门/部门,那么您最终将只得到 106 个查询(3 个用于地图,3 个用于加载代理,100 个用于插入学生)。
另一种优化方式
另一种方法是使用您收集的名称来获取您需要的所有实体:
$q = $em->createQuery('SELECT y FROM Entities\Year y INDEX BY y.year_name WHERE y.year_name IN(:years)');
$q->setParameter('years', $yearNames);
$yearsMap = $q->getResult();
您现在只需 1 个查询即可获得所需的所有 Year 实体。您可以对部门和部门执行相同的操作。
还请注意 DQL 语句中的 INDEX BY:这将确保您将获得一个以 year_name 为键和实体为值的数组。您可以像这样在循环中立即使用它:
$year = $yearsMap[$this->year[$i]];
$department = $departmentsMap[$this->branch[$i]];
$division = $divisionsMap[$this->division[$i]];
100 个学生的最终结果将始终是 103 个查询(3 个用于地图,100 个用于插入学生)。
缓存
当您需要相对频繁地运行此循环并且它会使数据库紧张时,使用 Doctrine 的 result cache 是明智的。不过有几点需要注意:
getReference() 不支持结果缓存(目前),结果缓存不会自动使用。所以我建议你把这样的东西放在一个存储库中:
public function findOneYearByName($name)
{
$q = $em->createQuery('SELECT y FROM Entities\Year y WHERE y.year_name = :year');
$q->setParameter('year', $name);
$q->useResultCache(true);
return $q->getSingleResult();
}
您可能想要配置结果缓存,请参阅docs 了解相关内容。
另一个注意事项是,结果缓存会缓存从数据库中提取的结果,然后再进行水合。因此,即使使用结果缓存,实际实体每次都会被水合。因此我仍然建议使用地图,但实现方式略有不同:
$yearsMap = array();
$departmentsMap = array();
$divisionsMap = array();
forloop (...):
if (!isset($yearsMap[$this->year[$i]])) {
$yearsMap[$this->year[$i]] = $this->em->getRepository('Entities\Year')->findOneYearByName($this->year[$i]);
}
if (!isset($departmentsMap[$this->branch[$i]])) {
$departmentsMap[$this->branch[$i]] = $this->em->getRepository('Entities\Department')->findOneDepartmentByName($this->branch[$i]);
}
if (!isset($divisionsMap[$this->division[$i]])) {
$divisionsMap[$this->division[$i]] = $this->em->getRepository('Entities\Division')->findOneDivisionByName($this->division[$i]);
}
$year = $yearsMap[$this->year[$i]];
$department = $departmentsMap[$this->branch[$i]];
$division = $divisionsMap[$this->division[$i]];
这将确保每个不同的年份/部门/部门只补水一次。
PS:将结果缓存用于“以另一种方式优化”的效率不会那么高,因为每次运行循环时,年份/部门/部门的名称都可能不同。每次更改名称时,查询都会更改,并且无法使用缓存的结果。
DBAL
在插入数据时,我可以直接从他们的姓名中获取年份、部门和部门的 ID 吗?
您可以,但您不会使用 ORM,而只会使用 DBAL。你基本上是这样做的:
$connection = $em->getConnection();
$statement = $conn->executeQuery('insert query', array('parameter1', 'etc'));
$statement->execute();
我怀疑这会更有效,因为 MySQL(或您使用的任何供应商)仍将为每个插入执行这 3 个(子)查询,它们只是不会“越过网络”。而且你没有从 ORM 获得任何帮助,比如管理关联等。
不过,您仍然可以找到有关 here 主题的所有内容。