upstream/mercurial-mirror Commit - r42968:4e7bd618

rust-discovery: optionally don't randomize at all, for tests...

Georges Racinet -

r42968:4e7bd618 default

parent child

mercurial/setdiscovery.py

0 +23 -9

                             dist.setdefault(p, d + 1)
                             visit.append(p)
-            def _limitsample(sample, desiredlen):
+            def _limitsample(sample, desiredlen, randomize=True):
-                """return a random subset of sample of at most desiredlen item"""
+                """return a random subset of sample of at most desiredlen item.
-                if len(sample) > desiredlen:
-                    sample = set(random.sample(sample, desiredlen))
+                If randomize is False, though, a deterministic subset is returned.
-                return sample
+                This is meant for integration tests.
+                """
+                if len(sample) <= desiredlen:
+                    return sample
+                if randomize:
+                    return set(random.sample(sample, desiredlen))
+                sample = list(sample)
+                sample.sort()
+                return set(sample[:desiredlen])
             class partialdiscovery(object):
                 """an object representing ongoing discovery
                 (all tracked revisions are known locally)
                 """
-                def __init__(self, repo, targetheads, respectsize):
+                def __init__(self, repo, targetheads, respectsize, randomize=True):
                     self._repo = repo
                     self._targetheads = targetheads
                     self._common = repo.changelog.incrementalmissingrevs()
                     self.missing = set()
                     self._childrenmap = None
                     self._respectsize = respectsize
+                    self.randomize = randomize
                 def addcommons(self, commons):
                     """register nodes known as common"""
                     sample = set(self._repo.revs('heads(%ld)', revs))
                     if len(sample) >= size:
-                        return _limitsample(sample, size)
+                        return _limitsample(sample, size, randomize=self.randomize)
                     _updatesample(None, headrevs, sample, self._parentsgetter(),
                                   quicksamplesize=size)
                     if not self._respectsize:
                         size = max(size, min(len(revsroots), len(revsheads)))
-                    sample = _limitsample(sample, size)
+                    sample = _limitsample(sample, size, randomize=self.randomize)
                     if len(sample) < size:
                         more = size - len(sample)
-                        sample.update(random.sample(list(revs - sample), more))
+                        takefrom = list(revs - sample)
+                        if self.randomize:
+                            sample.update(random.sample(takefrom, more))
+                        else:
+                            takefrom.sort()
+                            sample.update(takefrom[:more])
                     return sample
             def findcommonheads(ui, local, remote,

rust/hg-core/src/discovery.rs

0 +42 -4

                 missing: HashSet<Revision>,
                 rng: Rng,
                 respect_size: bool,
+                randomize: bool,
             }
             pub struct DiscoveryStats {
                 /// will interpret the size argument requested by the caller. If it's
                 /// `false`, they are allowed to produce a sample whose size is more
                 /// appropriate to the situation (typically bigger).
+                ///
+                /// The `randomize` boolean affects sampling, and specifically how
+                /// limiting or last-minute expanding is been done:
+                ///
+                /// If `true`, both will perform random picking from `self.undecided`.
+                /// This is currently the best for actual discoveries.
+                ///
+                /// If `false`, a reproductible picking strategy is performed. This is
+                /// useful for integration tests.
                 pub fn new(
                     graph: G,
                     target_heads: Vec<Revision>,
                     respect_size: bool,
+                    randomize: bool,
                 ) -> Self {
                     let mut seed: [u8; 16] = [0; 16];
-                    thread_rng().fill_bytes(&mut seed);
+                    if randomize {
-                    Self::new_with_seed(graph, target_heads, seed, respect_size)
+                        thread_rng().fill_bytes(&mut seed);
+                    }
+                    Self::new_with_seed(graph, target_heads, seed, respect_size, randomize)
                 }
                 pub fn new_with_seed(
                     target_heads: Vec<Revision>,
                     seed: [u8; 16],
                     respect_size: bool,
+                    randomize: bool,
                 ) -> Self {
                     PartialDiscovery {
                         undecided: None,
                         missing: HashSet::new(),
                         rng: Rng::from_seed(seed),
                         respect_size: respect_size,
+                        randomize: randomize,
                     }
                 }
                     mut sample: Vec<Revision>,
                     size: usize,
                 ) -> Vec<Revision> {
+                    if !self.randomize {
+                        sample.sort();
+                        sample.truncate(size);
+                        return sample;
+                    }
                     let sample_len = sample.len();
                     if sample_len <= size {
                         return sample;
                 /// A PartialDiscovery as for pushing all the heads of `SampleGraph`
                 ///
-                /// To avoid actual randomness in tests, we give it a fixed random seed.
+                /// To avoid actual randomness in these tests, we give it a fixed
+                /// random seed, but by default we'll test the random version.
                 fn full_disco() -> PartialDiscovery<SampleGraph> {
                     PartialDiscovery::new_with_seed(
                         SampleGraph,
                         vec![10, 11, 12, 13],
                         [0; 16],
                         true,
+                        true,
                     )
                 }
                 ///
                 /// To avoid actual randomness in tests, we give it a fixed random seed.
                 fn disco12() -> PartialDiscovery<SampleGraph> {
-                    PartialDiscovery::new_with_seed(SampleGraph, vec![12], [0; 16], true)
+                    PartialDiscovery::new_with_seed(
+                        SampleGraph,
+                        vec![12],
+                        [0; 16],
+                        true,
+                        true,
+                    )
                 }
                 fn sorted_undecided(
                 }
                 #[test]
+                fn test_limit_sample_no_random() {
+                    let mut disco = full_disco();
+                    disco.randomize = false;
+                    assert_eq!(
+                        disco.limit_sample(vec![1, 8, 13, 5, 7, 3], 4),
+                        vec![1, 3, 5, 7]
+                    );
+                }
+                #[test]
                 fn test_quick_sample_enough_undecided_heads() -> Result<(), GraphError> {
                     let mut disco = full_disco();
                     disco.undecided = Some((1..=13).collect());

rust/hg-cpython/src/discovery.rs

0 +4 -2

                     _cls,
                     repo: PyObject,
                     targetheads: PyObject,
-                    respectsize: bool
+                    respectsize: bool,
+                    randomize: bool = true
                 ) -> PyResult<PartialDiscovery> {
                     let index = repo.getattr(py, "changelog")?.getattr(py, "index")?;
                     Self::create_instance(
                         RefCell::new(Box::new(CorePartialDiscovery::new(
                             Index::new(py, index)?,
                             rev_pyiter_collect(py, &targetheads)?,
-                            respectsize
+                            respectsize,
+                            randomize,
                         )))
                     )
                 }

tests/test-rust-discovery.py

0 +3 0

                     self.assertTrue(disco.iscomplete())
                     self.assertEqual(disco.commonheads(), {1})
+                def testinitnorandom(self):
+                    PartialDiscovery(self.repo(), [3], True, randomize=False)
             if __name__ == '__main__':
                 import silenttestrunner
                 silenttestrunner.main(__name__)

General Comments 0

Write
Preview

You need to be logged in to leave comments. Login now

No TODOs yet

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages