【发布时间】:2025-11-24 20:05:02
【问题描述】:
我要做什么
我有一个划分事物的方法。此方法不对数组进行完全排序;它只是对数组进行分区,以便一侧的所有元素(一些预先确定的“中心”或“中点值” - 但它不必导致均匀分割)小于“中心”和另一侧的所有元素都大于中心。要点:这不是传统意义上的“排序”;这是一个分区。
当我对事物进行分区时,我需要保留一把钥匙;以便在交换事物时交换密钥;如果将来我想撤消分区,我可以根据键重新排列。
显然,要根据键值重新排列事物,我可以执行类似
的操作std::vector< std::pair< std::size_t , my::thingie > > vp;
std::vector< std::size_t >::iterator itKey( key.begin() );
// itThingie_begin and itThingie_end exist; I don't have direct access to the container
my::thingie::iterator itThingie( itThingie_begin );
for (; itKey != key.end(); ++itKey; ++itThingie ) vp.push_back( *itKey, *itThingie );
std::sort( vp.begin() , vp.end() , &comp_pair_first );
itThingie = itThingie_begin;
for ( std::vector< std::pair< std::size_t , my::thingie > >::const_iterator p=vp.begin(); p!=vp.end(); ++p, ++itThingie ) *itThingie = p->second;
意思是,我可以将所有的键和数据复制成一对;并使用自定义比较谓词(或使用 boost::bind)按第一个值(键)对对进行排序;然后再次将所有数据复制回来。我明白那个。这并不理想,因为我可能有几百兆字节的东西,而上述方法涉及将其复制到临时文件,对临时文件进行排序,然后将其复制回来。
这也不理想,因为我的分区方法,因为它目前存在,需要东西的键 AND 的开始和结束迭代器(因为它必须在每次交换时交换两者)。此外,-这是踢球者-如果有两组东西,我必须重写我的分区方法;我有一把钥匙,一个决定分区一侧的东西,还有另一个行李箱,里面有我想用于其他算法的其他信息。
现在,很明显,我不想重写分区方法每次我想包含一些其他迭代器来与分区“串联”交换。 所以,像以前一样,我可以将所有这些东西复制到一个临时的 std::pair 中(或者如果我需要串联交换更多东西,则可以嵌套对),然后通过查看 std::pair::first 对其进行分区,然后将临时数据复制回来... 但这非常浪费,因为我添加的每个额外的“行李”东西也可能是数百兆字节。
我知道我可以那样做。我不想那样做,因为它太占用内存了。
我想做的方式
我上面描述的问题只是串联操作迭代器的问题之一。因此,我想要一个迭代器集合来抽象出该集合的内容。
我想要一个迭代器的集合。我称该集合为piter(它是一对迭代器)。当一个交换两个 Piter 时,实际上是在他们的第一个迭代器(以及他们的第二个迭代器)上执行 std::iter_swap。
我想要一个piter迭代器(称为piterator),它具有迭代器的所有特性,但是当它递增和递减时,它是递增和递减piter的第一个和第二个迭代器。当piterator 解引用时,它应该返回对piter 的引用,它是迭代器的集合。所有距离都可以通过piter的第一个组件来测量。或者更一般地说,如果有任何问题需要回答,并且不清楚应该由哪个迭代器来回答,那么 Piter 的第一个迭代器应该回答它。
如果我想创建一个可以在多个迭代器上串联迭代器的piterator,我可以创建一个piterator,其piterator 包含一个迭代器(第一个)和另一个piterator(第二个)。
所以,这就是我尝试过的(我也尝试过使用 boost::iterator_facade 但我最终遇到了同样的问题 - 如下所述。)
#include <vector>
#include <iostream>
#include <algorithm>
#include <utility>
#include <iterator>
//
// pair of iterators
//
template <typename T,typename U>
struct piter : public std::pair<T,U>
{
piter() : std::pair<T,U>() {};
piter( T const & l , U const & r ) : std::pair<T,U>(l,r) {};
piter( std::pair<T,U> const & p ) { this->first = p.first; this->second = p.second; };
//piter( std::pair<T,U> const p ) { this->first = p.first; this->second = p.second; };
template <typename OT, typename OU>
piter( piter<OT,OU> const & p ) : std::pair<T,U>::first(p.first), std::pair<T,U>::second(p.second) {}
piter<T,U> & operator=( piter<T,U> const & rhs )
{
if( &rhs != this ) { *this->first = *rhs.first; *this->second = *rhs.second; }
return *this;
};
friend void swap( piter<T,U> & lhs, piter<T,U> & rhs )
{
using std::swap;
std::cout << "piter::swap; WAS: " << *lhs.first << " <-> " << *rhs.first << std::endl;
std::iter_swap(lhs.first,rhs.first);
std::iter_swap(lhs.second,rhs.second);
std::cout << "piter::swap; NOW: " << *lhs.first << " <-> " << *rhs.first << std::endl;
};
};
//
// iterator of pair of iterators
//
template <typename T, typename U>
class piterator : public std::iterator< std::random_access_iterator_tag,
piter<T,U>,
std::ptrdiff_t,
piter<T,U> *,
piter<T,U> & >
{
typedef piterator<T,U> iter;
public: // Traits typedefs, which make this class usable with algorithms which need a random access iterator.
typedef std::random_access_iterator_tag iterator_category;
typedef piter<T,U> value_type;
typedef std::ptrdiff_t difference_type;
typedef piter<T,U> * pointer;
typedef piter<T,U> & reference;
public:
piterator() {};
piterator( iter const & rhs ) { this->mp.first = rhs.mp.first; this->mp.second = rhs.mp.second;};
piterator( pointer rhs ) { this->mp.first = rhs->first; this->mp.second = rhs->second; };
//piterator( reference const rhs ) { this->mp.first = rhs.first; this->mp.second = rhs.second; };
piterator( value_type const rhs ) { this->mp.first = rhs.first; this->mp.second = rhs.second; };
iter & operator=( iter const & rhs )
{
if ( &rhs != this ){ this->mp.first = rhs.mp.first; this->mp.second = rhs.mp.second; };
return *this;
}
friend void swap( iter & lhs , iter & rhs )
{
using std::swap;
std::cout << "piterator::swap; WAS: lhs " << *lhs->first << " rhs " << *rhs->first << std::endl;
swap(lhs.mp,rhs.mp);
std::cout << "piterator::swap; NOW: lhs " << *lhs->first << " rhs " << *rhs->first << std::endl;
}
public: // Comparison
// Note: it's an error to compare iterators over different files.
bool operator< ( iter const & rhs ) const { return mp.first < rhs.mp.first; }
bool operator> ( iter const & rhs ) const { return mp.first > rhs.mp.first; }
bool operator==( iter const & rhs ) const { return mp.first == rhs.mp.first; }
bool operator!=( iter const & rhs ) const { return mp.first != rhs.mp.first; }
public: // Iteration
iter & operator++() { ++mp.first; ++mp.second; return *this; }
iter & operator--() { --mp.first; --mp.second; return *this; }
iter operator++(int) { iter tmp(*this); ++(*this); return tmp; }
iter operator--(int) { iter tmp(*this); --(*this); return tmp; }
public: // Step
iter & operator+=( difference_type n ) { mp.first += n; mp.second += n; return *this; }
iter & operator-=( difference_type n ) { mp.first -= n; mp.second -= n; return *this; }
iter operator+ ( difference_type n ) { iter result(*this); return result += n; }
iter operator- ( difference_type n ) { iter result(*this); return result -= n; }
public: // Distance
difference_type operator-( iter & rhs ) { return mp.first - rhs.mp.first; }
public: // Access
reference operator*() { return mp; }
reference operator[]( difference_type n ) { return *(*this+n); }
pointer operator->() { return ∓ };
private: // State
value_type mp;
};
template<class T,class U>
bool proxy_comp( piter<T,U> left, piter<T,U> right )
{
std::cout << "proxy_comp: " << *(left.first) << " > " << *(right.first) << " ?=? " << ( *(left.first) > *(right.first) ) << std::endl;
return *left.first > *right.first;
}
int main()
{
std::vector<double> dv(3);
std::vector<int> iv(3);
dv[0] = -0.5; dv[1] = -1.5; dv[2] = -2.5;
iv[0] = 10; iv[1] = 20; iv[2] = 3;
typedef piterator< std::vector<int>::iterator , std::vector<double>::iterator > PAIR_ITER;
typedef PAIR_ITER::value_type PAIR_REF;
PAIR_ITER pair_begin( PAIR_REF( iv.begin() , dv.begin() ) );
PAIR_ITER pair_end( PAIR_REF( iv.end() , dv.end() ) );
std::cout << "paired arrays now:" << std::endl;
for ( PAIR_ITER p = pair_begin; p != pair_end; ++p )
std::cout << *p->first << " " << *p->second << std::endl;
std::cout << "swap 1st and 3rd elements..." << std::endl;
swap(*pair_begin,*(pair_begin+2));
std::cout << "paired arrays now:" << std::endl;
for ( PAIR_ITER p = pair_begin; p != pair_end; ++p )
std::cout << *p->first << " " << *p->second << std::endl;
std::cout << "calling sort..." << std::endl;
std::sort( pair_begin , pair_end , &proxy_comp<std::vector<int>::iterator , std::vector<double>::iterator> );
std::cout << "paired arrays now:" << std::endl;
for ( PAIR_ITER p = pair_begin; p != pair_end; ++p )
std::cout << *p->first << " " << *p->second << std::endl;
return 0;
}
问题 当我尝试像使用所有其他迭代器一样使用它时,piter 和 piterator 似乎可以工作,但它不能与 STL 算法正常工作。
以上代码显示piter交换正确,但排序不正确。
以上代码的输出为:
paired arrays now:
10 -0.5
20 -1.5
3 -2.5
swap 1st and 3rd elements...
piter::swap; WAS: 10 <-> 3
piter::swap; NOW: 3 <-> 10
paired arrays now:
3 -2.5
20 -1.5
10 -0.5
calling sort...
proxy_comp: 20 > 3 ?=? 1
proxy_comp: 10 > 3 ?=? 1
paired arrays now:
3 -2.5
3 -2.5
3 -2.5
问题:
我必须改变什么才能使 std::sort(或者,理想情况下,通常是 stl)与piterators 一起正常工作?
【问题讨论】:
-
次要观点:
std::pair并不意味着继承自,你为什么不使用组合来代替(并取消对,它不会带来任何东西)。跨度> -
使用
std::partition会有用吗? -
@Kerrek SB std::partition 看起来不错,但它遇到了同样的基本问题,因为我需要保留一个密钥:我需要将所有数据复制到 std::vector 的临时 std::vector ::pair,根据 pair::first 对对进行分区,然后用分区的临时数据 OR 覆盖我的真实数据 - 这就是原始帖子的来源 - 我可以传递给 std: :partition 一个开始和结束的piterator,它将串联分区所有数据(键+数据+额外的东西)。所以,是的,std::partition 看起来不错,但这是同样的问题。
-
@TJ:诚然,我没有通读您的整个代码,但是您能否适当地更改容器的值类型(例如一对)并提供合适的谓词(例如第二个成员的比较)到分区函数?
-
@Kerrek SB:您建议有一些方法可以通过使用对来将 stl 算法与 tandom-swaps 结合使用。我同意,我在我的原始帖子中详细讨论了这个问题。在我对您的评论的回复中,我重申真正的问题与避免将所有内容复制到临时向量对中的需要有关,然后进行分区,然后将所有内容复制回来。在您的回复中,您建议在算法之外更改容器,但键值只是我正在编写的方法的算法的一部分,它不是 thingie 的一部分。