upstream/mercurial-mirror Commit - r42968:4e7bd618

rust-discovery: optionally don't randomize at all, for tests...

Georges Racinet -

r42968:4e7bd618 default

parent child

mercurial/setdiscovery.py

0 +23 -9

                              dist.setdefault(p, d + 1)
                              visit.append(p)
-             def _limitsample(sample, desiredlen):
-                 """return a random subset of sample of at most desiredlen item"""
-                 if len(sample) > desiredlen:
-                     sample = set(random.sample(sample, desiredlen))
-                 return sample
+             def _limitsample(sample, desiredlen, randomize=True):
+                 """return a random subset of sample of at most desiredlen item.
+                 If randomize is False, though, a deterministic subset is returned.
+                 This is meant for integration tests.
+                 """
+                 if len(sample) <= desiredlen:
+                     return sample
+                 if randomize:
+                     return set(random.sample(sample, desiredlen))
+                 sample = list(sample)
+                 sample.sort()
+                 return set(sample[:desiredlen])
              class partialdiscovery(object):
                  """an object representing ongoing discovery
                  (all tracked revisions are known locally)
                  """
-                 def __init__(self, repo, targetheads, respectsize):
+                 def __init__(self, repo, targetheads, respectsize, randomize=True):
                      self._repo = repo
                      self._targetheads = targetheads
                      self._common = repo.changelog.incrementalmissingrevs()
                      self.missing = set()
                      self._childrenmap = None
                      self._respectsize = respectsize
+                     self.randomize = randomize
                  def addcommons(self, commons):
                      """register nodes known as common"""
                      sample = set(self._repo.revs('heads(%ld)', revs))
                      if len(sample) >= size:
-                         return _limitsample(sample, size)
+                         return _limitsample(sample, size, randomize=self.randomize)
                      _updatesample(None, headrevs, sample, self._parentsgetter(),
                                    quicksamplesize=size)
                      if not self._respectsize:
                          size = max(size, min(len(revsroots), len(revsheads)))
-                     sample = _limitsample(sample, size)
+                     sample = _limitsample(sample, size, randomize=self.randomize)
                      if len(sample) < size:
                          more = size - len(sample)
-                         sample.update(random.sample(list(revs - sample), more))
+                         takefrom = list(revs - sample)
+                         if self.randomize:
+                             sample.update(random.sample(takefrom, more))
+                         else:
+                             takefrom.sort()
+                             sample.update(takefrom[:more])
                      return sample
              def findcommonheads(ui, local, remote,

rust/hg-core/src/discovery.rs

0 +42 -4

                  missing: HashSet<Revision>,
                  rng: Rng,
                  respect_size: bool,
+                 randomize: bool,
              }
              pub struct DiscoveryStats {
                  /// will interpret the size argument requested by the caller. If it's
                  /// `false`, they are allowed to produce a sample whose size is more
                  /// appropriate to the situation (typically bigger).
+                 ///
+                 /// The `randomize` boolean affects sampling, and specifically how
+                 /// limiting or last-minute expanding is been done:
+                 ///
+                 /// If `true`, both will perform random picking from `self.undecided`.
+                 /// This is currently the best for actual discoveries.
+                 ///
+                 /// If `false`, a reproductible picking strategy is performed. This is
+                 /// useful for integration tests.
                  pub fn new(
                      graph: G,
                      target_heads: Vec<Revision>,
                      respect_size: bool,
+                     randomize: bool,
                  ) -> Self {
                      let mut seed: [u8; 16] = [0; 16];
-                     thread_rng().fill_bytes(&mut seed);
-                     Self::new_with_seed(graph, target_heads, seed, respect_size)
+                     if randomize {
+                         thread_rng().fill_bytes(&mut seed);
+                     }
+                     Self::new_with_seed(graph, target_heads, seed, respect_size, randomize)
                  }
                  pub fn new_with_seed(
                      target_heads: Vec<Revision>,
                      seed: [u8; 16],
                      respect_size: bool,
+                     randomize: bool,
                  ) -> Self {
                      PartialDiscovery {
                          undecided: None,
                          missing: HashSet::new(),
                          rng: Rng::from_seed(seed),
                          respect_size: respect_size,
+                         randomize: randomize,
                      }
                  }
                      mut sample: Vec<Revision>,
                      size: usize,
                  ) -> Vec<Revision> {
+                     if !self.randomize {
+                         sample.sort();
+                         sample.truncate(size);
+                         return sample;
+                     }
                      let sample_len = sample.len();
                      if sample_len <= size {
                          return sample;
                  /// A PartialDiscovery as for pushing all the heads of `SampleGraph`
                  ///
-                 /// To avoid actual randomness in tests, we give it a fixed random seed.
+                 /// To avoid actual randomness in these tests, we give it a fixed
+                 /// random seed, but by default we'll test the random version.
                  fn full_disco() -> PartialDiscovery<SampleGraph> {
                      PartialDiscovery::new_with_seed(
                          SampleGraph,
                          vec![10, 11, 12, 13],
                          [0; 16],
                          true,
+                         true,
                      )
                  }
                  ///
                  /// To avoid actual randomness in tests, we give it a fixed random seed.
                  fn disco12() -> PartialDiscovery<SampleGraph> {
-                     PartialDiscovery::new_with_seed(SampleGraph, vec![12], [0; 16], true)
+                     PartialDiscovery::new_with_seed(
+                         SampleGraph,
+                         vec![12],
+                         [0; 16],
+                         true,
+                         true,
+                     )
                  }
                  fn sorted_undecided(
                  }
                  #[test]
+                 fn test_limit_sample_no_random() {
+                     let mut disco = full_disco();
+                     disco.randomize = false;
+                     assert_eq!(
+                         disco.limit_sample(vec![1, 8, 13, 5, 7, 3], 4),
+                         vec![1, 3, 5, 7]
+                     );
+                 }
+                 #[test]
                  fn test_quick_sample_enough_undecided_heads() -> Result<(), GraphError> {
                      let mut disco = full_disco();
                      disco.undecided = Some((1..=13).collect());

rust/hg-cpython/src/discovery.rs

0 +4 -2

                      _cls,
                      repo: PyObject,
                      targetheads: PyObject,
-                     respectsize: bool
+                     respectsize: bool,
+                     randomize: bool = true
                  ) -> PyResult<PartialDiscovery> {
                      let index = repo.getattr(py, "changelog")?.getattr(py, "index")?;
                      Self::create_instance(
                          RefCell::new(Box::new(CorePartialDiscovery::new(
                              Index::new(py, index)?,
                              rev_pyiter_collect(py, &targetheads)?,
-                             respectsize
+                             respectsize,
+                             randomize,
                          )))
                      )
                  }

tests/test-rust-discovery.py

0 +3 0

                      self.assertTrue(disco.iscomplete())
                      self.assertEqual(disco.commonheads(), {1})
+                 def testinitnorandom(self):
+                     PartialDiscovery(self.repo(), [3], True, randomize=False)
              if __name__ == '__main__':
                  import silenttestrunner
                  silenttestrunner.main(__name__)

General Comments 0

Write
Preview

You need to be logged in to leave comments. Login now

No TODOs yet

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages