upstream/mercurial-mirror Commit - r34148:75cc1f1e

1

# changegroup.py - Mercurial changegroup manipulation functions

1

# changegroup.py - Mercurial changegroup manipulation functions

2

#

2

#

3

4

#

4

#

5

# This software may be used and distributed according to the terms of the

5

# This software may be used and distributed according to the terms of the

6

# GNU General Public License version 2 or any later version.

6

# GNU General Public License version 2 or any later version.

7

8

from __future__ import absolute_import

8

from __future__ import absolute_import

9

10

import os

10

import os

11

import struct

11

import struct

12

import tempfile

12

import tempfile

13

import weakref

13

import weakref

14

15

from .i18n import _

15

from .i18n import _

16

from .node import (

16

from .node import (

17

hex,

17

hex,

18

nullrev,

18

nullrev,

19

short,

19

short,

20

)

20

)

21

22

from . import (

22

from . import (

23

dagutil,

23

dagutil,

24

error,

24

error,

25

mdiff,

25

mdiff,

26

phases,

26

phases,

27

pycompat,

27

pycompat,

28

util,

28

util,

29

)

29

)

30

31

_CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"

31

_CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"

32

_CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"

32

_CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"

33

_CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"

33

_CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"

34

35

def readexactly(stream, n):

35

def readexactly(stream, n):

36

'''read n bytes from stream.read and abort if less was available'''

36

'''read n bytes from stream.read and abort if less was available'''

37

s = stream.read(n)

37

s = stream.read(n)

38

if len(s) < n:

38

if len(s) < n:

39

raise error.Abort(_("stream ended unexpectedly"

39

raise error.Abort(_("stream ended unexpectedly"

40

" (got %d bytes, expected %d)")

40

" (got %d bytes, expected %d)")

41

% (len(s), n))

41

% (len(s), n))

42

return s

42

return s

43

44

def getchunk(stream):

44

def getchunk(stream):

45

"""return the next chunk from stream as a string"""

45

"""return the next chunk from stream as a string"""

46

d = readexactly(stream, 4)

46

d = readexactly(stream, 4)

47

l = struct.unpack(">l", d)[0]

47

l = struct.unpack(">l", d)[0]

48

if l <= 4:

48

if l <= 4:

49

if l:

49

if l:

50

raise error.Abort(_("invalid chunk length %d") % l)

50

raise error.Abort(_("invalid chunk length %d") % l)

51

return ""

51

return ""

52

return readexactly(stream, l - 4)

52

return readexactly(stream, l - 4)

53

54

def chunkheader(length):

54

def chunkheader(length):

55

"""return a changegroup chunk header (string)"""

55

"""return a changegroup chunk header (string)"""

56

return struct.pack(">l", length + 4)

56

return struct.pack(">l", length + 4)

57

58

def closechunk():

58

def closechunk():

59

"""return a changegroup chunk header (string) for a zero-length chunk"""

59

"""return a changegroup chunk header (string) for a zero-length chunk"""

60

return struct.pack(">l", 0)

60

return struct.pack(">l", 0)

61

62

def writechunks(ui, chunks, filename, vfs=None):

62

def writechunks(ui, chunks, filename, vfs=None):

63

"""Write chunks to a file and return its filename.

63

"""Write chunks to a file and return its filename.

64

65

The stream is assumed to be a bundle file.

65

The stream is assumed to be a bundle file.

66

Existing files will not be overwritten.

66

Existing files will not be overwritten.

67

If no filename is specified, a temporary file is created.

67

If no filename is specified, a temporary file is created.

68

"""

68

"""

69

fh = None

69

fh = None

70

cleanup = None

70

cleanup = None

71

try:

71

try:

72

if filename:

72

if filename:

73

if vfs:

73

if vfs:

74

fh = vfs.open(filename, "wb")

74

fh = vfs.open(filename, "wb")

75

else:

75

else:

76

# Increase default buffer size because default is usually

76

# Increase default buffer size because default is usually

77

# small (4k is common on Linux).

77

# small (4k is common on Linux).

78

fh = open(filename, "wb", 131072)

78

fh = open(filename, "wb", 131072)

79

else:

79

else:

80

fd, filename = tempfile.mkstemp(prefix="hg-bundle-", suffix=".hg")

80

fd, filename = tempfile.mkstemp(prefix="hg-bundle-", suffix=".hg")

81

fh = os.fdopen(fd, pycompat.sysstr("wb"))

81

fh = os.fdopen(fd, pycompat.sysstr("wb"))

82

cleanup = filename

82

cleanup = filename

83

for c in chunks:

83

for c in chunks:

84

fh.write(c)

84

fh.write(c)

85

cleanup = None

85

cleanup = None

86

return filename

86

return filename

87

finally:

87

finally:

88

if fh is not None:

88

if fh is not None:

89

fh.close()

89

fh.close()

90

if cleanup is not None:

90

if cleanup is not None:

91

if filename and vfs:

91

if filename and vfs:

92

vfs.unlink(cleanup)

92

vfs.unlink(cleanup)

93

else:

93

else:

94

os.unlink(cleanup)

94

os.unlink(cleanup)

95

96

class cg1unpacker(object):

96

class cg1unpacker(object):

97

"""Unpacker for cg1 changegroup streams.

97

"""Unpacker for cg1 changegroup streams.

98

99

A changegroup unpacker handles the framing of the revision data in

99

A changegroup unpacker handles the framing of the revision data in

100

the wire format. Most consumers will want to use the apply()

100

the wire format. Most consumers will want to use the apply()

101

method to add the changes from the changegroup to a repository.

101

method to add the changes from the changegroup to a repository.

102

103

If you're forwarding a changegroup unmodified to another consumer,

103

If you're forwarding a changegroup unmodified to another consumer,

104

use getchunks(), which returns an iterator of changegroup

104

use getchunks(), which returns an iterator of changegroup

105

chunks. This is mostly useful for cases where you need to know the

105

chunks. This is mostly useful for cases where you need to know the

106

data stream has ended by observing the end of the changegroup.

106

data stream has ended by observing the end of the changegroup.

107

108

deltachunk() is useful only if you're applying delta data. Most

108

deltachunk() is useful only if you're applying delta data. Most

109

consumers should prefer apply() instead.

109

consumers should prefer apply() instead.

110

111

A few other public methods exist. Those are used only for

111

A few other public methods exist. Those are used only for

112

bundlerepo and some debug commands - their use is discouraged.

112

bundlerepo and some debug commands - their use is discouraged.

113

"""

113

"""

114

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

114

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

115

deltaheadersize = struct.calcsize(deltaheader)

115

deltaheadersize = struct.calcsize(deltaheader)

116

version = '01'

116

version = '01'

117

_grouplistcount = 1 # One list of files after the manifests

117

_grouplistcount = 1 # One list of files after the manifests

118

119

def __init__(self, fh, alg, extras=None):

119

def __init__(self, fh, alg, extras=None):

120

if alg is None:

120

if alg is None:

121

alg = 'UN'

121

alg = 'UN'

122

if alg not in util.compengines.supportedbundletypes:

122

if alg not in util.compengines.supportedbundletypes:

123

raise error.Abort(_('unknown stream compression type: %s')

123

raise error.Abort(_('unknown stream compression type: %s')

124

% alg)

124

% alg)

125

if alg == 'BZ':

125

if alg == 'BZ':

126

alg = '_truncatedBZ'

126

alg = '_truncatedBZ'

127

128

compengine = util.compengines.forbundletype(alg)

128

compengine = util.compengines.forbundletype(alg)

129

self._stream = compengine.decompressorreader(fh)

129

self._stream = compengine.decompressorreader(fh)

130

self._type = alg

130

self._type = alg

131

self.extras = extras or {}

131

self.extras = extras or {}

132

self.callback = None

132

self.callback = None

133

134

# These methods (compressed, read, seek, tell) all appear to only

134

# These methods (compressed, read, seek, tell) all appear to only

135

# be used by bundlerepo, but it's a little hard to tell.

135

# be used by bundlerepo, but it's a little hard to tell.

136

def compressed(self):

136

def compressed(self):

137

return self._type is not None and self._type != 'UN'

137

return self._type is not None and self._type != 'UN'

138

def read(self, l):

138

def read(self, l):

139

return self._stream.read(l)

139

return self._stream.read(l)

140

def seek(self, pos):

140

def seek(self, pos):

141

return self._stream.seek(pos)

141

return self._stream.seek(pos)

142

def tell(self):

142

def tell(self):

143

return self._stream.tell()

143

return self._stream.tell()

144

def close(self):

144

def close(self):

145

return self._stream.close()

145

return self._stream.close()

146

147

def _chunklength(self):

147

def _chunklength(self):

148

d = readexactly(self._stream, 4)

148

d = readexactly(self._stream, 4)

149

l = struct.unpack(">l", d)[0]

149

l = struct.unpack(">l", d)[0]

150

if l <= 4:

150

if l <= 4:

151

if l:

151

if l:

152

raise error.Abort(_("invalid chunk length %d") % l)

152

raise error.Abort(_("invalid chunk length %d") % l)

153

return 0

153

return 0

154

if self.callback:

154

if self.callback:

155

self.callback()

155

self.callback()

156

return l - 4

156

return l - 4

157

158

def changelogheader(self):

158

def changelogheader(self):

159

"""v10 does not have a changelog header chunk"""

159

"""v10 does not have a changelog header chunk"""

160

return {}

160

return {}

161

162

def manifestheader(self):

162

def manifestheader(self):

163

"""v10 does not have a manifest header chunk"""

163

"""v10 does not have a manifest header chunk"""

164

return {}

164

return {}

165

166

def filelogheader(self):

166

def filelogheader(self):

167

"""return the header of the filelogs chunk, v10 only has the filename"""

167

"""return the header of the filelogs chunk, v10 only has the filename"""

168

l = self._chunklength()

168

l = self._chunklength()

169

if not l:

169

if not l:

170

return {}

170

return {}

171

fname = readexactly(self._stream, l)

171

fname = readexactly(self._stream, l)

172

return {'filename': fname}

172

return {'filename': fname}

173

174

def _deltaheader(self, headertuple, prevnode):

174

def _deltaheader(self, headertuple, prevnode):

175

node, p1, p2, cs = headertuple

175

node, p1, p2, cs = headertuple

176

if prevnode is None:

176

if prevnode is None:

177

deltabase = p1

177

deltabase = p1

178

else:

178

else:

179

deltabase = prevnode

179

deltabase = prevnode

180

flags = 0

180

flags = 0

181

return node, p1, p2, deltabase, cs, flags

181

return node, p1, p2, deltabase, cs, flags

182

183

def deltachunk(self, prevnode):

183

def deltachunk(self, prevnode):

184

l = self._chunklength()

184

l = self._chunklength()

185

if not l:

185

if not l:

186

return {}

186

return {}

187

headerdata = readexactly(self._stream, self.deltaheadersize)

187

headerdata = readexactly(self._stream, self.deltaheadersize)

188

header = struct.unpack(self.deltaheader, headerdata)

188

header = struct.unpack(self.deltaheader, headerdata)

189

delta = readexactly(self._stream, l - self.deltaheadersize)

189

delta = readexactly(self._stream, l - self.deltaheadersize)

190

node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)

190

node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)

191

return {'node': node, 'p1': p1, 'p2': p2, 'cs': cs,

191

return {'node': node, 'p1': p1, 'p2': p2, 'cs': cs,

192

'deltabase': deltabase, 'delta': delta, 'flags': flags}

192

'deltabase': deltabase, 'delta': delta, 'flags': flags}

193

194

def getchunks(self):

194

def getchunks(self):

195

"""returns all the chunks contains in the bundle

195

"""returns all the chunks contains in the bundle

196

197

Used when you need to forward the binary stream to a file or another

197

Used when you need to forward the binary stream to a file or another

198

network API. To do so, it parse the changegroup data, otherwise it will

198

network API. To do so, it parse the changegroup data, otherwise it will

199

block in case of sshrepo because it don't know the end of the stream.

199

block in case of sshrepo because it don't know the end of the stream.

200

"""

200

"""

201

# For changegroup 1 and 2, we expect 3 parts: changelog, manifestlog,

201

# For changegroup 1 and 2, we expect 3 parts: changelog, manifestlog,

202

# and a list of filelogs. For changegroup 3, we expect 4 parts:

202

# and a list of filelogs. For changegroup 3, we expect 4 parts:

203

# changelog, manifestlog, a list of tree manifestlogs, and a list of

203

# changelog, manifestlog, a list of tree manifestlogs, and a list of

204

# filelogs.

204

# filelogs.

205

#

205

#

206

# Changelog and manifestlog parts are terminated with empty chunks. The

206

# Changelog and manifestlog parts are terminated with empty chunks. The

207

# tree and file parts are a list of entry sections. Each entry section

207

# tree and file parts are a list of entry sections. Each entry section

208

# is a series of chunks terminating in an empty chunk. The list of these

208

# is a series of chunks terminating in an empty chunk. The list of these

209

# entry sections is terminated in yet another empty chunk, so we know

209

# entry sections is terminated in yet another empty chunk, so we know

210

# we've reached the end of the tree/file list when we reach an empty

210

# we've reached the end of the tree/file list when we reach an empty

211

# chunk that was proceeded by no non-empty chunks.

211

# chunk that was proceeded by no non-empty chunks.

212

213

parts = 0

213

parts = 0

214

while parts < 2 + self._grouplistcount:

214

while parts < 2 + self._grouplistcount:

215

noentries = True

215

noentries = True

216

while True:

216

while True:

217

chunk = getchunk(self)

217

chunk = getchunk(self)

218

if not chunk:

218

if not chunk:

219

# The first two empty chunks represent the end of the

219

# The first two empty chunks represent the end of the

220

# changelog and the manifestlog portions. The remaining

220

# changelog and the manifestlog portions. The remaining

221

# empty chunks represent either A) the end of individual

221

# empty chunks represent either A) the end of individual

222

# tree or file entries in the file list, or B) the end of

222

# tree or file entries in the file list, or B) the end of

223

# the entire list. It's the end of the entire list if there

223

# the entire list. It's the end of the entire list if there

224

# were no entries (i.e. noentries is True).

224

# were no entries (i.e. noentries is True).

225

if parts < 2:

225

if parts < 2:

226

parts += 1

226

parts += 1

227

elif noentries:

227

elif noentries:

228

parts += 1

228

parts += 1

229

break

229

break

230

noentries = False

230

noentries = False

231

yield chunkheader(len(chunk))

231

yield chunkheader(len(chunk))

232

pos = 0

232

pos = 0

233

while pos < len(chunk):

233

while pos < len(chunk):

234

next = pos + 2**20

234

next = pos + 2**20

235

yield chunk[pos:next]

235

yield chunk[pos:next]

236

pos = next

236

pos = next

237

yield closechunk()

237

yield closechunk()

238

239

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

239

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

240

# We know that we'll never have more manifests than we had

240

# We know that we'll never have more manifests than we had

241

# changesets.

241

# changesets.

242

self.callback = prog(_('manifests'), numchanges)

242

self.callback = prog(_('manifests'), numchanges)

243

# no need to check for empty manifest group here:

243

# no need to check for empty manifest group here:

244

# if the result of the merge of 1 and 2 is the same in 3 and 4,

244

# if the result of the merge of 1 and 2 is the same in 3 and 4,

245

# no new manifest will be created and the manifest group will

245

# no new manifest will be created and the manifest group will

246

# be empty during the pull

246

# be empty during the pull

247

self.manifestheader()

247

self.manifestheader()

248

deltas = self.deltaiter(revmap)

248

deltas = self.deltaiter(revmap)

249

repo.manifestlog._revlog.addgroup(deltas, trp)

249

repo.manifestlog._revlog.addgroup(deltas, trp)

250

repo.ui.progress(_('manifests'), None)

250

repo.ui.progress(_('manifests'), None)

251

self.callback = None

251

self.callback = None

252

253

def apply(self, repo, tr, srctype, url, targetphase=phases.draft,

253

def apply(self, repo, tr, srctype, url, targetphase=phases.draft,

254

expectedtotal=None):

254

expectedtotal=None):

255

"""Add the changegroup returned by source.read() to this repo.

255

"""Add the changegroup returned by source.read() to this repo.

256

srctype is a string like 'push', 'pull', or 'unbundle'. url is

256

srctype is a string like 'push', 'pull', or 'unbundle'. url is

257

the URL of the repo where this changegroup is coming from.

257

the URL of the repo where this changegroup is coming from.

258

259

Return an integer summarizing the change to this repo:

259

Return an integer summarizing the change to this repo:

260

- nothing changed or no source: 0

260

- nothing changed or no source: 0

261

- more heads than before: 1+added heads (2..n)

261

- more heads than before: 1+added heads (2..n)

262

- fewer heads than before: -1-removed heads (-2..-n)

262

- fewer heads than before: -1-removed heads (-2..-n)

263

- number of heads stays the same: 1

263

- number of heads stays the same: 1

264

"""

264

"""

265

repo = repo.unfiltered()

265

repo = repo.unfiltered()

266

def csmap(x):

266

def csmap(x):

267

repo.ui.debug("add changeset %s\n" % short(x))

267

repo.ui.debug("add changeset %s\n" % short(x))

268

return len(cl)

268

return len(cl)

269

270

def revmap(x):

270

def revmap(x):

271

return cl.rev(x)

271

return cl.rev(x)

272

273

changesets = files = revisions = 0

273

changesets = files = revisions = 0

274

275

try:

275

try:

276

# The transaction may already carry source information. In this

276

# The transaction may already carry source information. In this

277

# case we use the top level data. We overwrite the argument

277

# case we use the top level data. We overwrite the argument

278

# because we need to use the top level value (if they exist)

278

# because we need to use the top level value (if they exist)

279

# in this function.

279

# in this function.

280

srctype = tr.hookargs.setdefault('source', srctype)

280

srctype = tr.hookargs.setdefault('source', srctype)

281

url = tr.hookargs.setdefault('url', url)

281

url = tr.hookargs.setdefault('url', url)

282

repo.hook('prechangegroup',

282

repo.hook('prechangegroup',

283

throw=True, **pycompat.strkwargs(tr.hookargs))

283

throw=True, **pycompat.strkwargs(tr.hookargs))

284

285

# write changelog data to temp files so concurrent readers

285

# write changelog data to temp files so concurrent readers

286

# will not see an inconsistent view

286

# will not see an inconsistent view

287

cl = repo.changelog

287

cl = repo.changelog

288

cl.delayupdate(tr)

288

cl.delayupdate(tr)

289

oldheads = set(cl.heads())

289

oldheads = set(cl.heads())

290

291

trp = weakref.proxy(tr)

291

trp = weakref.proxy(tr)

292

# pull off the changeset group

292

# pull off the changeset group

293

repo.ui.status(_("adding changesets\n"))

293

repo.ui.status(_("adding changesets\n"))

294

clstart = len(cl)

294

clstart = len(cl)

295

class prog(object):

295

class prog(object):

296

def __init__(self, step, total):

296

def __init__(self, step, total):

297

self._step = step

297

self._step = step

298

self._total = total

298

self._total = total

299

self._count = 1

299

self._count = 1

300

def __call__(self):

300

def __call__(self):

301

repo.ui.progress(self._step, self._count, unit=_('chunks'),

301

repo.ui.progress(self._step, self._count, unit=_('chunks'),

302

total=self._total)

302

total=self._total)

303

self._count += 1

303

self._count += 1

304

self.callback = prog(_('changesets'), expectedtotal)

304

self.callback = prog(_('changesets'), expectedtotal)

305

306

efiles = set()

306

efiles = set()

307

def onchangelog(cl, node):

307

def onchangelog(cl, node):

308

efiles.update(cl.readfiles(node))

308

efiles.update(cl.readfiles(node))

309

310

self.changelogheader()

310

self.changelogheader()

311

deltas = self.deltaiter(csmap)

311

deltas = self.deltaiter(csmap)

312

cgnodes = cl.addgroup(deltas, trp, addrevisioncb=onchangelog)

312

cgnodes = cl.addgroup(deltas, trp, addrevisioncb=onchangelog)

313

efiles = len(efiles)

313

efiles = len(efiles)

314

315

if not cgnodes:

315

if not cgnodes:

316

repo.ui.develwarn('applied empty changegroup',

316

repo.ui.develwarn('applied empty changegroup',

317

config='empty-changegroup')

317

config='empty-changegroup')

318

clend = len(cl)

318

clend = len(cl)

319

changesets = clend - clstart

319

changesets = clend - clstart

320

repo.ui.progress(_('changesets'), None)

320

repo.ui.progress(_('changesets'), None)

321

self.callback = None

321

self.callback = None

322

323

# pull off the manifest group

323

# pull off the manifest group

324

repo.ui.status(_("adding manifests\n"))

324

repo.ui.status(_("adding manifests\n"))

325

self._unpackmanifests(repo, revmap, trp, prog, changesets)

325

self._unpackmanifests(repo, revmap, trp, prog, changesets)

326

327

needfiles = {}

327

needfiles = {}

328

if repo.ui.configbool('server', 'validate'):

328

if repo.ui.configbool('server', 'validate'):

329

cl = repo.changelog

329

cl = repo.changelog

330

ml = repo.manifestlog

330

ml = repo.manifestlog

331

# validate incoming csets have their manifests

331

# validate incoming csets have their manifests

332

for cset in xrange(clstart, clend):

332

for cset in xrange(clstart, clend):

333

mfnode = cl.changelogrevision(cset).manifest

333

mfnode = cl.changelogrevision(cset).manifest

334

mfest = ml[mfnode].readdelta()

334

mfest = ml[mfnode].readdelta()

335

# store file cgnodes we must see

335

# store file cgnodes we must see

336

for f, n in mfest.iteritems():

336

for f, n in mfest.iteritems():

337

needfiles.setdefault(f, set()).add(n)

337

needfiles.setdefault(f, set()).add(n)

338

339

# process the files

339

# process the files

340

repo.ui.status(_("adding file changes\n"))

340

repo.ui.status(_("adding file changes\n"))

341

newrevs, newfiles = _addchangegroupfiles(

341

newrevs, newfiles = _addchangegroupfiles(

342

repo, self, revmap, trp, efiles, needfiles)

342

repo, self, revmap, trp, efiles, needfiles)

343

revisions += newrevs

343

revisions += newrevs

344

files += newfiles

344

files += newfiles

345

346

deltaheads = 0

346

deltaheads = 0

347

if oldheads:

347

if oldheads:

348

heads = cl.heads()

348

heads = cl.heads()

349

deltaheads = len(heads) - len(oldheads)

349

deltaheads = len(heads) - len(oldheads)

350

for h in heads:

350

for h in heads:

351

if h not in oldheads and repo[h].closesbranch():

351

if h not in oldheads and repo[h].closesbranch():

352

deltaheads -= 1

352

deltaheads -= 1

353

htext = ""

353

htext = ""

354

if deltaheads:

354

if deltaheads:

355

htext = _(" (%+d heads)") % deltaheads

355

htext = _(" (%+d heads)") % deltaheads

356

357

repo.ui.status(_("added %d changesets"

357

repo.ui.status(_("added %d changesets"

358

" with %d changes to %d files%s\n")

358

" with %d changes to %d files%s\n")

359

% (changesets, revisions, files, htext))

359

% (changesets, revisions, files, htext))

360

repo.invalidatevolatilesets()

360

repo.invalidatevolatilesets()

361

362

if changesets > 0:

362

if changesets > 0:

363

if 'node' not in tr.hookargs:

363

if 'node' not in tr.hookargs:

364

tr.hookargs['node'] = hex(cl.node(clstart))

364

tr.hookargs['node'] = hex(cl.node(clstart))

365

tr.hookargs['node_last'] = hex(cl.node(clend - 1))

365

tr.hookargs['node_last'] = hex(cl.node(clend - 1))

366

hookargs = dict(tr.hookargs)

366

hookargs = dict(tr.hookargs)

367

else:

367

else:

368

hookargs = dict(tr.hookargs)

368

hookargs = dict(tr.hookargs)

369

hookargs['node'] = hex(cl.node(clstart))

369

hookargs['node'] = hex(cl.node(clstart))

370

hookargs['node_last'] = hex(cl.node(clend - 1))

370

hookargs['node_last'] = hex(cl.node(clend - 1))

371

repo.hook('pretxnchangegroup',

371

repo.hook('pretxnchangegroup',

372

throw=True, **pycompat.strkwargs(hookargs))

372

throw=True, **pycompat.strkwargs(hookargs))

373

374

added = [cl.node(r) for r in xrange(clstart, clend)]

374

added = [cl.node(r) for r in xrange(clstart, clend)]

375

phaseall = None

375

phaseall = None

376

if srctype in ('push', 'serve'):

376

if srctype in ('push', 'serve'):

377

# Old servers can not push the boundary themselves.

377

# Old servers can not push the boundary themselves.

378

# New servers won't push the boundary if changeset already

378

# New servers won't push the boundary if changeset already

379

# exists locally as secret

379

# exists locally as secret

380

#

380

#

381

# We should not use added here but the list of all change in

381

# We should not use added here but the list of all change in

382

# the bundle

382

# the bundle

383

if repo.publishing():

383

if repo.publishing():

384

targetphase = phaseall = phases.public

384

targetphase = phaseall = phases.public

385

else:

385

else:

386

# closer target phase computation

386

# closer target phase computation

387

388

# Those changesets have been pushed from the

388

# Those changesets have been pushed from the

389

# outside, their phases are going to be pushed

389

# outside, their phases are going to be pushed

390

# alongside. Therefor `targetphase` is

390

# alongside. Therefor `targetphase` is

391

# ignored.

391

# ignored.

392

targetphase = phaseall = phases.draft

392

targetphase = phaseall = phases.draft

393

if added:

393

if added:

394

phases.registernew(repo, tr, targetphase, added)

394

phases.registernew(repo, tr, targetphase, added)

395

if phaseall is not None:

395

if phaseall is not None:

396

phases.advanceboundary(repo, tr, phaseall, cgnodes)

396

phases.advanceboundary(repo, tr, phaseall, cgnodes)

397

398

if changesets > 0:

398

if changesets > 0:

399

400

def runhooks():

400

def runhooks():

401

# These hooks run when the lock releases, not when the

401

# These hooks run when the lock releases, not when the

402

# transaction closes. So it's possible for the changelog

402

# transaction closes. So it's possible for the changelog

403

# to have changed since we last saw it.

403

# to have changed since we last saw it.

404

if clstart >= len(repo):

404

if clstart >= len(repo):

405

return

405

return

406

407

repo.hook("changegroup", **pycompat.strkwargs(hookargs))

407

repo.hook("changegroup", **pycompat.strkwargs(hookargs))

408

409

for n in added:

409

for n in added:

410

args = hookargs.copy()

410

args = hookargs.copy()

411

args['node'] = hex(n)

411

args['node'] = hex(n)

412

del args['node_last']

412

del args['node_last']

413

repo.hook("incoming", **pycompat.strkwargs(args))

413

repo.hook("incoming", **pycompat.strkwargs(args))

414

415

newheads = [h for h in repo.heads()

415

newheads = [h for h in repo.heads()

416

if h not in oldheads]

416

if h not in oldheads]

417

repo.ui.log("incoming",

417

repo.ui.log("incoming",

418

"%s incoming changes - new heads: %s\n",

418

"%s incoming changes - new heads: %s\n",

419

len(added),

419

len(added),

420

', '.join([hex(c[:6]) for c in newheads]))

420

', '.join([hex(c[:6]) for c in newheads]))

421

422

tr.addpostclose('changegroup-runhooks-%020i' % clstart,

422

tr.addpostclose('changegroup-runhooks-%020i' % clstart,

423

lambda tr: repo._afterlock(runhooks))

423

lambda tr: repo._afterlock(runhooks))

424

finally:

424

finally:

425

repo.ui.flush()

425

repo.ui.flush()

426

# never return 0 here:

426

# never return 0 here:

427

if deltaheads < 0:

427

if deltaheads < 0:

428

ret = deltaheads - 1

428

ret = deltaheads - 1

429

else:

429

else:

430

ret = deltaheads + 1

430

ret = deltaheads + 1

431

return ret

431

return ret

432

433

def deltaiter(self, linkmapper):

433

def deltaiter(self, linkmapper):

434

"""

434

"""

435

returns an iterator of the deltas in this changegroup

435

returns an iterator of the deltas in this changegroup

436

437

Useful for passing to the underlying storage system to be stored.

437

Useful for passing to the underlying storage system to be stored.

438

"""

438

"""

439

chain = None

439

chain = None

440

for chunkdata in iter(lambda: self.deltachunk(chain), {}):

440

for chunkdata in iter(lambda: self.deltachunk(chain), {}):

441

node = chunkdata['node']

441

node = chunkdata['node']

442

p1 = chunkdata['p1']

442

p1 = chunkdata['p1']

443

p2 = chunkdata['p2']

443

p2 = chunkdata['p2']

444

cs = chunkdata['cs']

444

cs = chunkdata['cs']

445

deltabase = chunkdata['deltabase']

445

deltabase = chunkdata['deltabase']

446

delta = chunkdata['delta']

446

delta = chunkdata['delta']

447

flags = chunkdata['flags']

447

flags = chunkdata['flags']

448

449

link = linkmapper(cs)

449

link = linkmapper(cs)

450

chain = node

450

chain = node

451

452

yield (node, p1, p2, link, deltabase, delta, flags)

452

yield (node, p1, p2, link, deltabase, delta, flags)

453

454

class cg2unpacker(cg1unpacker):

454

class cg2unpacker(cg1unpacker):

455

"""Unpacker for cg2 streams.

455

"""Unpacker for cg2 streams.

456

457

cg2 streams add support for generaldelta, so the delta header

457

cg2 streams add support for generaldelta, so the delta header

458

format is slightly different. All other features about the data

458

format is slightly different. All other features about the data

459

remain the same.

459

remain the same.

460

"""

460

"""

461

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

461

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

462

deltaheadersize = struct.calcsize(deltaheader)

462

deltaheadersize = struct.calcsize(deltaheader)

463

version = '02'

463

version = '02'

464

465

def _deltaheader(self, headertuple, prevnode):

465

def _deltaheader(self, headertuple, prevnode):

466

node, p1, p2, deltabase, cs = headertuple

466

node, p1, p2, deltabase, cs = headertuple

467

flags = 0

467

flags = 0

468

return node, p1, p2, deltabase, cs, flags

468

return node, p1, p2, deltabase, cs, flags

469

470

class cg3unpacker(cg2unpacker):

470

class cg3unpacker(cg2unpacker):

471

"""Unpacker for cg3 streams.

471

"""Unpacker for cg3 streams.

472

473

cg3 streams add support for exchanging treemanifests and revlog

473

cg3 streams add support for exchanging treemanifests and revlog

474

flags. It adds the revlog flags to the delta header and an empty chunk

474

flags. It adds the revlog flags to the delta header and an empty chunk

475

separating manifests and files.

475

separating manifests and files.

476

"""

476

"""

477

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

477

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

478

deltaheadersize = struct.calcsize(deltaheader)

478

deltaheadersize = struct.calcsize(deltaheader)

479

version = '03'

479

version = '03'

480

_grouplistcount = 2 # One list of manifests and one list of files

480

_grouplistcount = 2 # One list of manifests and one list of files

481

482

def _deltaheader(self, headertuple, prevnode):

482

def _deltaheader(self, headertuple, prevnode):

483

node, p1, p2, deltabase, cs, flags = headertuple

483

node, p1, p2, deltabase, cs, flags = headertuple

484

return node, p1, p2, deltabase, cs, flags

484

return node, p1, p2, deltabase, cs, flags

485

486

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

486

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

487

super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog,

487

super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog,

488

numchanges)

488

numchanges)

489

for chunkdata in iter(self.filelogheader, {}):

489

for chunkdata in iter(self.filelogheader, {}):

490

# If we get here, there are directory manifests in the changegroup

490

# If we get here, there are directory manifests in the changegroup

491

d = chunkdata["filename"]

491

d = chunkdata["filename"]

492

repo.ui.debug("adding %s revisions\n" % d)

492

repo.ui.debug("adding %s revisions\n" % d)

493

dirlog = repo.manifestlog._revlog.dirlog(d)

493

dirlog = repo.manifestlog._revlog.dirlog(d)

494

deltas = self.deltaiter(revmap)

494

deltas = self.deltaiter(revmap)

495

if not dirlog.addgroup(deltas, trp):

495

if not dirlog.addgroup(deltas, trp):

496

raise error.Abort(_("received dir revlog group is empty"))

496

raise error.Abort(_("received dir revlog group is empty"))

497

498

class headerlessfixup(object):

498

class headerlessfixup(object):

499

def __init__(self, fh, h):

499

def __init__(self, fh, h):

500

self._h = h

500

self._h = h

501

self._fh = fh

501

self._fh = fh

502

def read(self, n):

502

def read(self, n):

503

if self._h:

503

if self._h:

504

d, self._h = self._h[:n], self._h[n:]

504

d, self._h = self._h[:n], self._h[n:]

505

if len(d) < n:

505

if len(d) < n:

506

d += readexactly(self._fh, n - len(d))

506

d += readexactly(self._fh, n - len(d))

507

return d

507

return d

508

return readexactly(self._fh, n)

508

return readexactly(self._fh, n)

509

510

class cg1packer(object):

510

class cg1packer(object):

511

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

511

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

512

version = '01'

512

version = '01'

513

def __init__(self, repo, bundlecaps=None):

513

def __init__(self, repo, bundlecaps=None):

514

"""Given a source repo, construct a bundler.

514

"""Given a source repo, construct a bundler.

515

516

bundlecaps is optional and can be used to specify the set of

516

bundlecaps is optional and can be used to specify the set of

517

capabilities which can be used to build the bundle. While bundlecaps is

517

capabilities which can be used to build the bundle. While bundlecaps is

518

unused in core Mercurial, extensions rely on this feature to communicate

518

unused in core Mercurial, extensions rely on this feature to communicate

519

capabilities to customize the changegroup packer.

519

capabilities to customize the changegroup packer.

520

"""

520

"""

521

# Set of capabilities we can use to build the bundle.

521

# Set of capabilities we can use to build the bundle.

522

if bundlecaps is None:

522

if bundlecaps is None:

523

bundlecaps = set()

523

bundlecaps = set()

524

self._bundlecaps = bundlecaps

524

self._bundlecaps = bundlecaps

525

# experimental config: bundle.reorder

525

# experimental config: bundle.reorder

526

reorder = repo.ui.config('bundle', 'reorder')

526

reorder = repo.ui.config('bundle', 'reorder')

527

if reorder == 'auto':

527

if reorder == 'auto':

528

reorder = None

528

reorder = None

529

else:

529

else:

530

reorder = util.parsebool(reorder)

530

reorder = util.parsebool(reorder)

531

self._repo = repo

531

self._repo = repo

532

self._reorder = reorder

532

self._reorder = reorder

533

self._progress = repo.ui.progress

533

self._progress = repo.ui.progress

534

if self._repo.ui.verbose and not self._repo.ui.debugflag:

534

if self._repo.ui.verbose and not self._repo.ui.debugflag:

535

self._verbosenote = self._repo.ui.note

535

self._verbosenote = self._repo.ui.note

536

else:

536

else:

537

self._verbosenote = lambda s: None

537

self._verbosenote = lambda s: None

538

539

def close(self):

539

def close(self):

540

return closechunk()

540

return closechunk()

541

542

def fileheader(self, fname):

542

def fileheader(self, fname):

543

return chunkheader(len(fname)) + fname

543

return chunkheader(len(fname)) + fname

544

545

# Extracted both for clarity and for overriding in extensions.

545

# Extracted both for clarity and for overriding in extensions.

546

def _sortgroup(self, revlog, nodelist, lookup):

546

def _sortgroup(self, revlog, nodelist, lookup):

547

"""Sort nodes for change group and turn them into revnums."""

547

"""Sort nodes for change group and turn them into revnums."""

548

# for generaldelta revlogs, we linearize the revs; this will both be

548

# for generaldelta revlogs, we linearize the revs; this will both be

549

# much quicker and generate a much smaller bundle

549

# much quicker and generate a much smaller bundle

550

if (revlog._generaldelta and self._reorder is None) or self._reorder:

550

if (revlog._generaldelta and self._reorder is None) or self._reorder:

551

dag = dagutil.revlogdag(revlog)

551

dag = dagutil.revlogdag(revlog)

552

return dag.linearize(set(revlog.rev(n) for n in nodelist))

552

return dag.linearize(set(revlog.rev(n) for n in nodelist))

553

else:

553

else:

554

return sorted([revlog.rev(n) for n in nodelist])

554

return sorted([revlog.rev(n) for n in nodelist])

555

556

def group(self, nodelist, revlog, lookup, units=None):

556

def group(self, nodelist, revlog, lookup, units=None):

557

"""Calculate a delta group, yielding a sequence of changegroup chunks

557

"""Calculate a delta group, yielding a sequence of changegroup chunks

558

(strings).

558

(strings).

559

560

Given a list of changeset revs, return a set of deltas and

560

Given a list of changeset revs, return a set of deltas and

561

metadata corresponding to nodes. The first delta is

561

metadata corresponding to nodes. The first delta is

562

first parent(nodelist[0]) -> nodelist[0], the receiver is

562

first parent(nodelist[0]) -> nodelist[0], the receiver is

563

guaranteed to have this parent as it has all history before

563

guaranteed to have this parent as it has all history before

564

these changesets. In the case firstparent is nullrev the

564

these changesets. In the case firstparent is nullrev the

565

changegroup starts with a full revision.

565

changegroup starts with a full revision.

566

567

If units is not None, progress detail will be generated, units specifies

567

If units is not None, progress detail will be generated, units specifies

568

the type of revlog that is touched (changelog, manifest, etc.).

568

the type of revlog that is touched (changelog, manifest, etc.).

569

"""

569

"""

570

# if we don't have any revisions touched by these changesets, bail

570

# if we don't have any revisions touched by these changesets, bail

571

if len(nodelist) == 0:

571

if len(nodelist) == 0:

572

yield self.close()

572

yield self.close()

573

return

573

return

574

575

revs = self._sortgroup(revlog, nodelist, lookup)

575

revs = self._sortgroup(revlog, nodelist, lookup)

576

577

# add the parent of the first rev

577

# add the parent of the first rev

578

p = revlog.parentrevs(revs[0])[0]

578

p = revlog.parentrevs(revs[0])[0]

579

revs.insert(0, p)

579

revs.insert(0, p)

580

581

# build deltas

581

# build deltas

582

total = len(revs) - 1

582

total = len(revs) - 1

583

msgbundling = _('bundling')

583

msgbundling = _('bundling')

584

for r in xrange(len(revs) - 1):

584

for r in xrange(len(revs) - 1):

585

if units is not None:

585

if units is not None:

586

self._progress(msgbundling, r + 1, unit=units, total=total)

586

self._progress(msgbundling, r + 1, unit=units, total=total)

587

prev, curr = revs[r], revs[r + 1]

587

prev, curr = revs[r], revs[r + 1]

588

linknode = lookup(revlog.node(curr))

588

linknode = lookup(revlog.node(curr))

589

for c in self.revchunk(revlog, curr, prev, linknode):

589

for c in self.revchunk(revlog, curr, prev, linknode):

590

yield c

590

yield c

591

592

if units is not None:

592

if units is not None:

593

self._progress(msgbundling, None)

593

self._progress(msgbundling, None)

594

yield self.close()

594

yield self.close()

595

596

# filter any nodes that claim to be part of the known set

596

# filter any nodes that claim to be part of the known set

597

def prune(self, revlog, missing, commonrevs):

597

def prune(self, revlog, missing, commonrevs):

598

rr, rl = revlog.rev, revlog.linkrev

598

rr, rl = revlog.rev, revlog.linkrev

599

return [n for n in missing if rl(rr(n)) not in commonrevs]

599

return [n for n in missing if rl(rr(n)) not in commonrevs]

600

601

def _packmanifests(self, dir, mfnodes, lookuplinknode):

601

def _packmanifests(self, dir, mfnodes, lookuplinknode):

602

"""Pack flat manifests into a changegroup stream."""

602

"""Pack flat manifests into a changegroup stream."""

603

assert not dir

603

assert not dir

604

for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,

604

for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,

605

lookuplinknode, units=_('manifests')):

605

lookuplinknode, units=_('manifests')):

606

yield chunk

606

yield chunk

607

608

def _manifestsdone(self):

608

def _manifestsdone(self):

609

return ''

609

return ''

610

611

def generate(self, commonrevs, clnodes, fastpathlinkrev, source):

611

def generate(self, commonrevs, clnodes, fastpathlinkrev, source):

612

'''yield a sequence of changegroup chunks (strings)'''

612

'''yield a sequence of changegroup chunks (strings)'''

613

repo = self._repo

613

repo = self._repo

614

cl = repo.changelog

614

cl = repo.changelog

615

616

clrevorder = {}

616

clrevorder = {}

617

mfs = {} # needed manifests

617

mfs = {} # needed manifests

618

fnodes = {} # needed file nodes

618

fnodes = {} # needed file nodes

619

changedfiles = set()

619

changedfiles = set()

620

621

# Callback for the changelog, used to collect changed files and manifest

621

# Callback for the changelog, used to collect changed files and manifest

622

# nodes.

622

# nodes.

623

# Returns the linkrev node (identity in the changelog case).

623

# Returns the linkrev node (identity in the changelog case).

624

def lookupcl(x):

624

def lookupcl(x):

625

c = cl.read(x)

625

c = cl.read(x)

626

clrevorder[x] = len(clrevorder)

626

clrevorder[x] = len(clrevorder)

627

n = c[0]

627

n = c[0]

628

# record the first changeset introducing this manifest version

628

# record the first changeset introducing this manifest version

629

mfs.setdefault(n, x)

629

mfs.setdefault(n, x)

630

# Record a complete list of potentially-changed files in

630

# Record a complete list of potentially-changed files in

631

# this manifest.

631

# this manifest.

632

changedfiles.update(c[3])

632

changedfiles.update(c[3])

633

return x

633

return x

634

635

self._verbosenote(_('uncompressed size of bundle content:\n'))

635

self._verbosenote(_('uncompressed size of bundle content:\n'))

636

size = 0

636

size = 0

637

for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):

637

for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):

638

size += len(chunk)

638

size += len(chunk)

639

yield chunk

639

yield chunk

640

self._verbosenote(_('%8.i (changelog)\n') % size)

640

self._verbosenote(_('%8.i (changelog)\n') % size)

641

642

# We need to make sure that the linkrev in the changegroup refers to

642

# We need to make sure that the linkrev in the changegroup refers to

643

# the first changeset that introduced the manifest or file revision.

643

# the first changeset that introduced the manifest or file revision.

644

# The fastpath is usually safer than the slowpath, because the filelogs

644

# The fastpath is usually safer than the slowpath, because the filelogs

645

# are walked in revlog order.

645

# are walked in revlog order.

646

#

646

#

647

# When taking the slowpath with reorder=None and the manifest revlog

647

# When taking the slowpath with reorder=None and the manifest revlog

648

# uses generaldelta, the manifest may be walked in the "wrong" order.

648

# uses generaldelta, the manifest may be walked in the "wrong" order.

649

# Without 'clrevorder', we would get an incorrect linkrev (see fix in

649

# Without 'clrevorder', we would get an incorrect linkrev (see fix in

650

# cc0ff93d0c0c).

650

# cc0ff93d0c0c).

651

#

651

#

652

# When taking the fastpath, we are only vulnerable to reordering

652

# When taking the fastpath, we are only vulnerable to reordering

653

# of the changelog itself. The changelog never uses generaldelta, so

653

# of the changelog itself. The changelog never uses generaldelta, so

654

# it is only reordered when reorder=True. To handle this case, we

654

# it is only reordered when reorder=True. To handle this case, we

655

# simply take the slowpath, which already has the 'clrevorder' logic.

655

# simply take the slowpath, which already has the 'clrevorder' logic.

656

# This was also fixed in cc0ff93d0c0c.

656

# This was also fixed in cc0ff93d0c0c.

657

fastpathlinkrev = fastpathlinkrev and not self._reorder

657

fastpathlinkrev = fastpathlinkrev and not self._reorder

658

# Treemanifests don't work correctly with fastpathlinkrev

658

# Treemanifests don't work correctly with fastpathlinkrev

659

# either, because we don't discover which directory nodes to

659

# either, because we don't discover which directory nodes to

660

# send along with files. This could probably be fixed.

660

# send along with files. This could probably be fixed.

661

fastpathlinkrev = fastpathlinkrev and (

661

fastpathlinkrev = fastpathlinkrev and (

662

'treemanifest' not in repo.requirements)

662

'treemanifest' not in repo.requirements)

663

664

for chunk in self.generatemanifests(commonrevs, clrevorder,

664

for chunk in self.generatemanifests(commonrevs, clrevorder,

665

fastpathlinkrev, mfs, fnodes):

665

fastpathlinkrev, mfs, fnodes, source):

666

yield chunk

666

yield chunk

667

mfs.clear()

667

mfs.clear()

668

clrevs = set(cl.rev(x) for x in clnodes)

668

clrevs = set(cl.rev(x) for x in clnodes)

669

670

if not fastpathlinkrev:

670

if not fastpathlinkrev:

671

def linknodes(unused, fname):

671

def linknodes(unused, fname):

672

return fnodes.get(fname, {})

672

return fnodes.get(fname, {})

673

else:

673

else:

674

cln = cl.node

674

cln = cl.node

675

def linknodes(filerevlog, fname):

675

def linknodes(filerevlog, fname):

676

llr = filerevlog.linkrev

676

llr = filerevlog.linkrev

677

fln = filerevlog.node

677

fln = filerevlog.node

678

revs = ((r, llr(r)) for r in filerevlog)

678

revs = ((r, llr(r)) for r in filerevlog)

679

return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)

679

return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)

680

681

for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,

681

for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,

682

source):

682

source):

683

yield chunk

683

yield chunk

684

685

yield self.close()

685

yield self.close()

686

687

if clnodes:

687

if clnodes:

688

repo.hook('outgoing', node=hex(clnodes[0]), source=source)

688

repo.hook('outgoing', node=hex(clnodes[0]), source=source)

689

690

def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,

690

def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,

691

fnodes):

691

fnodes, source):

692

"""Returns an iterator of changegroup chunks containing manifests.

693

694

`source` is unused here, but is used by extensions like remotefilelog to

695

change what is sent based in pulls vs pushes, etc.

696

"""

692

repo = self._repo

697

repo = self._repo

693

mfl = repo.manifestlog

698

mfl = repo.manifestlog

694

dirlog = mfl._revlog.dirlog

699

dirlog = mfl._revlog.dirlog

695

tmfnodes = {'': mfs}

700

tmfnodes = {'': mfs}

696

701

697

# Callback for the manifest, used to collect linkrevs for filelog

702

# Callback for the manifest, used to collect linkrevs for filelog

698

# revisions.

703

# revisions.

699

# Returns the linkrev node (collected in lookupcl).

704

# Returns the linkrev node (collected in lookupcl).

700

def makelookupmflinknode(dir):

705

def makelookupmflinknode(dir):

701

if fastpathlinkrev:

706

if fastpathlinkrev:

702

assert not dir

707

assert not dir

703

return mfs.__getitem__

708

return mfs.__getitem__

704

709

705

def lookupmflinknode(x):

710

def lookupmflinknode(x):

706

"""Callback for looking up the linknode for manifests.

711

"""Callback for looking up the linknode for manifests.

707

712

708

Returns the linkrev node for the specified manifest.

713

Returns the linkrev node for the specified manifest.

709

714

710

SIDE EFFECT:

715

SIDE EFFECT:

711

716

712

1) fclnodes gets populated with the list of relevant

717

1) fclnodes gets populated with the list of relevant

713

file nodes if we're not using fastpathlinkrev

718

file nodes if we're not using fastpathlinkrev

714

2) When treemanifests are in use, collects treemanifest nodes

719

2) When treemanifests are in use, collects treemanifest nodes

715

to send

720

to send

716

721

717

Note that this means manifests must be completely sent to

722

Note that this means manifests must be completely sent to

718

the client before you can trust the list of files and

723

the client before you can trust the list of files and

719

treemanifests to send.

724

treemanifests to send.

720

"""

725

"""

721

clnode = tmfnodes[dir][x]

726

clnode = tmfnodes[dir][x]

722

mdata = mfl.get(dir, x).readfast(shallow=True)

727

mdata = mfl.get(dir, x).readfast(shallow=True)

723

for p, n, fl in mdata.iterentries():

728

for p, n, fl in mdata.iterentries():

724

if fl == 't': # subdirectory manifest

729

if fl == 't': # subdirectory manifest

725

subdir = dir + p + '/'

730

subdir = dir + p + '/'

726

tmfclnodes = tmfnodes.setdefault(subdir, {})

731

tmfclnodes = tmfnodes.setdefault(subdir, {})

727

tmfclnode = tmfclnodes.setdefault(n, clnode)

732

tmfclnode = tmfclnodes.setdefault(n, clnode)

728

if clrevorder[clnode] < clrevorder[tmfclnode]:

733

if clrevorder[clnode] < clrevorder[tmfclnode]:

729

tmfclnodes[n] = clnode

734

tmfclnodes[n] = clnode

730

else:

735

else:

731

f = dir + p

736

f = dir + p

732

fclnodes = fnodes.setdefault(f, {})

737

fclnodes = fnodes.setdefault(f, {})

733

fclnode = fclnodes.setdefault(n, clnode)

738

fclnode = fclnodes.setdefault(n, clnode)

734

if clrevorder[clnode] < clrevorder[fclnode]:

739

if clrevorder[clnode] < clrevorder[fclnode]:

735

fclnodes[n] = clnode

740

fclnodes[n] = clnode

736

return clnode

741

return clnode

737

return lookupmflinknode

742

return lookupmflinknode

738

743

739

size = 0

744

size = 0

740

while tmfnodes:

745

while tmfnodes:

741

dir = min(tmfnodes)

746

dir = min(tmfnodes)

742

nodes = tmfnodes[dir]

747

nodes = tmfnodes[dir]

743

prunednodes = self.prune(dirlog(dir), nodes, commonrevs)

748

prunednodes = self.prune(dirlog(dir), nodes, commonrevs)

744

if not dir or prunednodes:

749

if not dir or prunednodes:

745

for x in self._packmanifests(dir, prunednodes,

750

for x in self._packmanifests(dir, prunednodes,

746

makelookupmflinknode(dir)):

751

makelookupmflinknode(dir)):

747

size += len(x)

752

size += len(x)

748

yield x

753

yield x

749

del tmfnodes[dir]

754

del tmfnodes[dir]

750

self._verbosenote(_('%8.i (manifests)\n') % size)

755

self._verbosenote(_('%8.i (manifests)\n') % size)

751

yield self._manifestsdone()

756

yield self._manifestsdone()

752

757

753

# The 'source' parameter is useful for extensions

758

# The 'source' parameter is useful for extensions

754

def generatefiles(self, changedfiles, linknodes, commonrevs, source):

759

def generatefiles(self, changedfiles, linknodes, commonrevs, source):

755

repo = self._repo

760

repo = self._repo

756

progress = self._progress

761

progress = self._progress

757

msgbundling = _('bundling')

762

msgbundling = _('bundling')

758

763

759

total = len(changedfiles)

764

total = len(changedfiles)

760

# for progress output

765

# for progress output

761

msgfiles = _('files')

766

msgfiles = _('files')

762

for i, fname in enumerate(sorted(changedfiles)):

767

for i, fname in enumerate(sorted(changedfiles)):

763

filerevlog = repo.file(fname)

768

filerevlog = repo.file(fname)

764

if not filerevlog:

769

if not filerevlog:

765

raise error.Abort(_("empty or missing revlog for %s") % fname)

770

raise error.Abort(_("empty or missing revlog for %s") % fname)

766

771

767

linkrevnodes = linknodes(filerevlog, fname)

772

linkrevnodes = linknodes(filerevlog, fname)

768

# Lookup for filenodes, we collected the linkrev nodes above in the

773

# Lookup for filenodes, we collected the linkrev nodes above in the

769

# fastpath case and with lookupmf in the slowpath case.

774

# fastpath case and with lookupmf in the slowpath case.

770

def lookupfilelog(x):

775

def lookupfilelog(x):

771

return linkrevnodes[x]

776

return linkrevnodes[x]

772

777

773

filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)

778

filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)

774

if filenodes:

779

if filenodes:

775

progress(msgbundling, i + 1, item=fname, unit=msgfiles,

780

progress(msgbundling, i + 1, item=fname, unit=msgfiles,

776

total=total)

781

total=total)

777

h = self.fileheader(fname)

782

h = self.fileheader(fname)

778

size = len(h)

783

size = len(h)

779

yield h

784

yield h

780

for chunk in self.group(filenodes, filerevlog, lookupfilelog):

785

for chunk in self.group(filenodes, filerevlog, lookupfilelog):

781

size += len(chunk)

786

size += len(chunk)

782

yield chunk

787

yield chunk

783

self._verbosenote(_('%8.i %s\n') % (size, fname))

788

self._verbosenote(_('%8.i %s\n') % (size, fname))

784

progress(msgbundling, None)

789

progress(msgbundling, None)

785

790

786

def deltaparent(self, revlog, rev, p1, p2, prev):

791

def deltaparent(self, revlog, rev, p1, p2, prev):

787

return prev

792

return prev

788

793

789

def revchunk(self, revlog, rev, prev, linknode):

794

def revchunk(self, revlog, rev, prev, linknode):

790

node = revlog.node(rev)

795

node = revlog.node(rev)

791

p1, p2 = revlog.parentrevs(rev)

796

p1, p2 = revlog.parentrevs(rev)

792

base = self.deltaparent(revlog, rev, p1, p2, prev)

797

base = self.deltaparent(revlog, rev, p1, p2, prev)

793

798

794

prefix = ''

799

prefix = ''

795

if revlog.iscensored(base) or revlog.iscensored(rev):

800

if revlog.iscensored(base) or revlog.iscensored(rev):

796

try:

801

try:

797

delta = revlog.revision(node, raw=True)

802

delta = revlog.revision(node, raw=True)

798

except error.CensoredNodeError as e:

803

except error.CensoredNodeError as e:

799

delta = e.tombstone

804

delta = e.tombstone

800

if base == nullrev:

805

if base == nullrev:

801

prefix = mdiff.trivialdiffheader(len(delta))

806

prefix = mdiff.trivialdiffheader(len(delta))

802

else:

807

else:

803

baselen = revlog.rawsize(base)

808

baselen = revlog.rawsize(base)

804

prefix = mdiff.replacediffheader(baselen, len(delta))

809

prefix = mdiff.replacediffheader(baselen, len(delta))

805

elif base == nullrev:

810

elif base == nullrev:

806

delta = revlog.revision(node, raw=True)

811

delta = revlog.revision(node, raw=True)

807

prefix = mdiff.trivialdiffheader(len(delta))

812

prefix = mdiff.trivialdiffheader(len(delta))

808

else:

813

else:

809

delta = revlog.revdiff(base, rev)

814

delta = revlog.revdiff(base, rev)

810

p1n, p2n = revlog.parents(node)

815

p1n, p2n = revlog.parents(node)

811

basenode = revlog.node(base)

816

basenode = revlog.node(base)

812

flags = revlog.flags(rev)

817

flags = revlog.flags(rev)

813

meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)

818

meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)

814

meta += prefix

819

meta += prefix

815

l = len(meta) + len(delta)

820

l = len(meta) + len(delta)

816

yield chunkheader(l)

821

yield chunkheader(l)

817

yield meta

822

yield meta

818

yield delta

823

yield delta

819

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

824

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

820

# do nothing with basenode, it is implicitly the previous one in HG10

825

# do nothing with basenode, it is implicitly the previous one in HG10

821

# do nothing with flags, it is implicitly 0 for cg1 and cg2

826

# do nothing with flags, it is implicitly 0 for cg1 and cg2

822

return struct.pack(self.deltaheader, node, p1n, p2n, linknode)

827

return struct.pack(self.deltaheader, node, p1n, p2n, linknode)

823

828

824

class cg2packer(cg1packer):

829

class cg2packer(cg1packer):

825

version = '02'

830

version = '02'

826

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

831

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

827

832

828

def __init__(self, repo, bundlecaps=None):

833

def __init__(self, repo, bundlecaps=None):

829

super(cg2packer, self).__init__(repo, bundlecaps)

834

super(cg2packer, self).__init__(repo, bundlecaps)

830

if self._reorder is None:

835

if self._reorder is None:

831

# Since generaldelta is directly supported by cg2, reordering

836

# Since generaldelta is directly supported by cg2, reordering

832

# generally doesn't help, so we disable it by default (treating

837

# generally doesn't help, so we disable it by default (treating

833

# bundle.reorder=auto just like bundle.reorder=False).

838

# bundle.reorder=auto just like bundle.reorder=False).

834

self._reorder = False

839

self._reorder = False

835

840

836

def deltaparent(self, revlog, rev, p1, p2, prev):

841

def deltaparent(self, revlog, rev, p1, p2, prev):

837

dp = revlog.deltaparent(rev)

842

dp = revlog.deltaparent(rev)

838

if dp == nullrev and revlog.storedeltachains:

843

if dp == nullrev and revlog.storedeltachains:

839

# Avoid sending full revisions when delta parent is null. Pick prev

844

# Avoid sending full revisions when delta parent is null. Pick prev

840

# in that case. It's tempting to pick p1 in this case, as p1 will

845

# in that case. It's tempting to pick p1 in this case, as p1 will

841

# be smaller in the common case. However, computing a delta against

846

# be smaller in the common case. However, computing a delta against

842

# p1 may require resolving the raw text of p1, which could be

847

# p1 may require resolving the raw text of p1, which could be

843

# expensive. The revlog caches should have prev cached, meaning

848

# expensive. The revlog caches should have prev cached, meaning

844

# less CPU for changegroup generation. There is likely room to add

849

# less CPU for changegroup generation. There is likely room to add

845

# a flag and/or config option to control this behavior.

850

# a flag and/or config option to control this behavior.

846

return prev

851

return prev

847

elif dp == nullrev:

852

elif dp == nullrev:

848

# revlog is configured to use full snapshot for a reason,

853

# revlog is configured to use full snapshot for a reason,

849

# stick to full snapshot.

854

# stick to full snapshot.

850

return nullrev

855

return nullrev

851

elif dp not in (p1, p2, prev):

856

elif dp not in (p1, p2, prev):

852

# Pick prev when we can't be sure remote has the base revision.

857

# Pick prev when we can't be sure remote has the base revision.

853

return prev

858

return prev

854

else:

859

else:

855

return dp

860

return dp

856

861

857

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

862

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

858

# Do nothing with flags, it is implicitly 0 in cg1 and cg2

863

# Do nothing with flags, it is implicitly 0 in cg1 and cg2

859

return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)

864

return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)

860

865

861

class cg3packer(cg2packer):

866

class cg3packer(cg2packer):

862

version = '03'

867

version = '03'

863

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

868

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

864

869

865

def _packmanifests(self, dir, mfnodes, lookuplinknode):

870

def _packmanifests(self, dir, mfnodes, lookuplinknode):

866

if dir:

871

if dir:

867

yield self.fileheader(dir)

872

yield self.fileheader(dir)

868

873

869

dirlog = self._repo.manifestlog._revlog.dirlog(dir)

874

dirlog = self._repo.manifestlog._revlog.dirlog(dir)

870

for chunk in self.group(mfnodes, dirlog, lookuplinknode,

875

for chunk in self.group(mfnodes, dirlog, lookuplinknode,

871

units=_('manifests')):

876

units=_('manifests')):

872

yield chunk

877

yield chunk

873

878

874

def _manifestsdone(self):

879

def _manifestsdone(self):

875

return self.close()

880

return self.close()

876

881

877

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

882

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

878

return struct.pack(

883

return struct.pack(

879

self.deltaheader, node, p1n, p2n, basenode, linknode, flags)

884

self.deltaheader, node, p1n, p2n, basenode, linknode, flags)

880

885

881

_packermap = {'01': (cg1packer, cg1unpacker),

886

_packermap = {'01': (cg1packer, cg1unpacker),

882

# cg2 adds support for exchanging generaldelta

887

# cg2 adds support for exchanging generaldelta

883

'02': (cg2packer, cg2unpacker),

888

'02': (cg2packer, cg2unpacker),

884

# cg3 adds support for exchanging revlog flags and treemanifests

889

# cg3 adds support for exchanging revlog flags and treemanifests

885

'03': (cg3packer, cg3unpacker),

890

'03': (cg3packer, cg3unpacker),

886

}

891

}

887

892

888

def allsupportedversions(repo):

893

def allsupportedversions(repo):

889

versions = set(_packermap.keys())

894

versions = set(_packermap.keys())

890

if not (repo.ui.configbool('experimental', 'changegroup3') or

895

if not (repo.ui.configbool('experimental', 'changegroup3') or

891

repo.ui.configbool('experimental', 'treemanifest') or

896

repo.ui.configbool('experimental', 'treemanifest') or

892

'treemanifest' in repo.requirements):

897

'treemanifest' in repo.requirements):

893

versions.discard('03')

898

versions.discard('03')

894

return versions

899

return versions

895

900

896

# Changegroup versions that can be applied to the repo

901

# Changegroup versions that can be applied to the repo

897

def supportedincomingversions(repo):

902

def supportedincomingversions(repo):

898

return allsupportedversions(repo)

903

return allsupportedversions(repo)

899

904

900

# Changegroup versions that can be created from the repo

905

# Changegroup versions that can be created from the repo

901

def supportedoutgoingversions(repo):

906

def supportedoutgoingversions(repo):

902

versions = allsupportedversions(repo)

907

versions = allsupportedversions(repo)

903

if 'treemanifest' in repo.requirements:

908

if 'treemanifest' in repo.requirements:

904

# Versions 01 and 02 support only flat manifests and it's just too

909

# Versions 01 and 02 support only flat manifests and it's just too

905

# expensive to convert between the flat manifest and tree manifest on

910

# expensive to convert between the flat manifest and tree manifest on

906

# the fly. Since tree manifests are hashed differently, all of history

911

# the fly. Since tree manifests are hashed differently, all of history

907

# would have to be converted. Instead, we simply don't even pretend to

912

# would have to be converted. Instead, we simply don't even pretend to

908

# support versions 01 and 02.

913

# support versions 01 and 02.

909

versions.discard('01')

914

versions.discard('01')

910

versions.discard('02')

915

versions.discard('02')

911

return versions

916

return versions

912

917

913

def safeversion(repo):

918

def safeversion(repo):

914

# Finds the smallest version that it's safe to assume clients of the repo

919

# Finds the smallest version that it's safe to assume clients of the repo

915

# will support. For example, all hg versions that support generaldelta also

920

# will support. For example, all hg versions that support generaldelta also

916

# support changegroup 02.

921

# support changegroup 02.

917

versions = supportedoutgoingversions(repo)

922

versions = supportedoutgoingversions(repo)

918

if 'generaldelta' in repo.requirements:

923

if 'generaldelta' in repo.requirements:

919

versions.discard('01')

924

versions.discard('01')

920

assert versions

925

assert versions

921

return min(versions)

926

return min(versions)

922

927

923

def getbundler(version, repo, bundlecaps=None):

928

def getbundler(version, repo, bundlecaps=None):

924

assert version in supportedoutgoingversions(repo)

929

assert version in supportedoutgoingversions(repo)

925

return _packermap[version][0](repo, bundlecaps)

930

return _packermap[version][0](repo, bundlecaps)

926

931

927

def getunbundler(version, fh, alg, extras=None):

932

def getunbundler(version, fh, alg, extras=None):

928

return _packermap[version][1](fh, alg, extras=extras)

933

return _packermap[version][1](fh, alg, extras=extras)

929

934

930

def _changegroupinfo(repo, nodes, source):

935

def _changegroupinfo(repo, nodes, source):

931

if repo.ui.verbose or source == 'bundle':

936

if repo.ui.verbose or source == 'bundle':

932

repo.ui.status(_("%d changesets found\n") % len(nodes))

937

repo.ui.status(_("%d changesets found\n") % len(nodes))

933

if repo.ui.debugflag:

938

if repo.ui.debugflag:

934

repo.ui.debug("list of changesets:\n")

939

repo.ui.debug("list of changesets:\n")

935

for node in nodes:

940

for node in nodes:

936

repo.ui.debug("%s\n" % hex(node))

941

repo.ui.debug("%s\n" % hex(node))

937

942

938

def makechangegroup(repo, outgoing, version, source, fastpath=False,

943

def makechangegroup(repo, outgoing, version, source, fastpath=False,

939

bundlecaps=None):

944

bundlecaps=None):

940

cgstream = makestream(repo, outgoing, version, source,

945

cgstream = makestream(repo, outgoing, version, source,

941

fastpath=fastpath, bundlecaps=bundlecaps)

946

fastpath=fastpath, bundlecaps=bundlecaps)

942

return getunbundler(version, util.chunkbuffer(cgstream), None,

947

return getunbundler(version, util.chunkbuffer(cgstream), None,

943

{'clcount': len(outgoing.missing) })

948

{'clcount': len(outgoing.missing) })

944

949

945

def makestream(repo, outgoing, version, source, fastpath=False,

950

def makestream(repo, outgoing, version, source, fastpath=False,

946

bundlecaps=None):

951

bundlecaps=None):

947

bundler = getbundler(version, repo, bundlecaps=bundlecaps)

952

bundler = getbundler(version, repo, bundlecaps=bundlecaps)

948

953

949

repo = repo.unfiltered()

954

repo = repo.unfiltered()

950

commonrevs = outgoing.common

955

commonrevs = outgoing.common

951

csets = outgoing.missing

956

csets = outgoing.missing

952

heads = outgoing.missingheads

957

heads = outgoing.missingheads

953

# We go through the fast path if we get told to, or if all (unfiltered

958

# We go through the fast path if we get told to, or if all (unfiltered

954

# heads have been requested (since we then know there all linkrevs will

959

# heads have been requested (since we then know there all linkrevs will

955

# be pulled by the client).

960

# be pulled by the client).

956

heads.sort()

961

heads.sort()

957

fastpathlinkrev = fastpath or (

962

fastpathlinkrev = fastpath or (

958

repo.filtername is None and heads == sorted(repo.heads()))

963

repo.filtername is None and heads == sorted(repo.heads()))

959

964

960

repo.hook('preoutgoing', throw=True, source=source)

965

repo.hook('preoutgoing', throw=True, source=source)

961

_changegroupinfo(repo, csets, source)

966

_changegroupinfo(repo, csets, source)

962

return bundler.generate(commonrevs, csets, fastpathlinkrev, source)

967

return bundler.generate(commonrevs, csets, fastpathlinkrev, source)

963

968

964

def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):

969

def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):

965

revisions = 0

970

revisions = 0

966

files = 0

971

files = 0

967

for chunkdata in iter(source.filelogheader, {}):

972

for chunkdata in iter(source.filelogheader, {}):

968

files += 1

973

files += 1

969

f = chunkdata["filename"]

974

f = chunkdata["filename"]

970

repo.ui.debug("adding %s revisions\n" % f)

975

repo.ui.debug("adding %s revisions\n" % f)

971

repo.ui.progress(_('files'), files, unit=_('files'),

976

repo.ui.progress(_('files'), files, unit=_('files'),

972

total=expectedfiles)

977

total=expectedfiles)

973

fl = repo.file(f)

978

fl = repo.file(f)

974

o = len(fl)

979

o = len(fl)

975

try:

980

try:

976

deltas = source.deltaiter(revmap)

981

deltas = source.deltaiter(revmap)

977

if not fl.addgroup(deltas, trp):

982

if not fl.addgroup(deltas, trp):

978

raise error.Abort(_("received file revlog group is empty"))

983

raise error.Abort(_("received file revlog group is empty"))

979

except error.CensoredBaseError as e:

984

except error.CensoredBaseError as e:

980

raise error.Abort(_("received delta base is censored: %s") % e)

985

raise error.Abort(_("received delta base is censored: %s") % e)

981

revisions += len(fl) - o

986

revisions += len(fl) - o

982

if f in needfiles:

987

if f in needfiles:

983

needs = needfiles[f]

988

needs = needfiles[f]

984

for new in xrange(o, len(fl)):

989

for new in xrange(o, len(fl)):

985

n = fl.node(new)

990

n = fl.node(new)

986

if n in needs:

991

if n in needs:

987

needs.remove(n)

992

needs.remove(n)

988

else:

993

else:

989

raise error.Abort(

994

raise error.Abort(

990

_("received spurious file revlog entry"))

995

_("received spurious file revlog entry"))

991

if not needs:

996

if not needs:

992

del needfiles[f]

997

del needfiles[f]

993

repo.ui.progress(_('files'), None)

998

repo.ui.progress(_('files'), None)

994

999

995

for f, needs in needfiles.iteritems():

1000

for f, needs in needfiles.iteritems():

996

fl = repo.file(f)

1001

fl = repo.file(f)

997

for n in needs:

1002

for n in needs:

998

try:

1003

try:

999

fl.rev(n)

1004

fl.rev(n)

1000

except error.LookupError:

1005

except error.LookupError:

1001

raise error.Abort(

1006

raise error.Abort(

1002

_('missing file data for %s:%s - run hg verify') %

1007

_('missing file data for %s:%s - run hg verify') %

1003

(f, hex(n)))

1008

(f, hex(n)))

1004

1009

1005

return revisions, files

1010

return revisions, files

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # changegroup.py - Mercurial changegroup manipulation functions
             #
             #  Copyright 2006 Matt Mackall <mpm@selenic.com>
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             from __future__ import absolute_import
             import os
             import struct
             import tempfile
             import weakref
             from .i18n import _
             from .node import (
                 hex,
                 nullrev,
                 short,
             )
             from . import (
                 dagutil,
                 error,
                 mdiff,
                 phases,
                 pycompat,
                 util,
             )
             _CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"
             _CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"
             _CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"
             def readexactly(stream, n):
                 '''read n bytes from stream.read and abort if less was available'''
                 s = stream.read(n)
                 if len(s) < n:
                     raise error.Abort(_("stream ended unexpectedly"
                                        " (got %d bytes, expected %d)")
                                       % (len(s), n))
                 return s
             def getchunk(stream):
                 """return the next chunk from stream as a string"""
                 d = readexactly(stream, 4)
                 l = struct.unpack(">l", d)[0]
                 if l <= 4:
                     if l:
                         raise error.Abort(_("invalid chunk length %d") % l)
                     return ""
                 return readexactly(stream, l - 4)
             def chunkheader(length):
                 """return a changegroup chunk header (string)"""
                 return struct.pack(">l", length + 4)
             def closechunk():
                 """return a changegroup chunk header (string) for a zero-length chunk"""
                 return struct.pack(">l", 0)
             def writechunks(ui, chunks, filename, vfs=None):
                 """Write chunks to a file and return its filename.
                 The stream is assumed to be a bundle file.
                 Existing files will not be overwritten.
                 If no filename is specified, a temporary file is created.
                 """
                 fh = None
                 cleanup = None
                 try:
                     if filename:
                         if vfs:
                             fh = vfs.open(filename, "wb")
                         else:
                             # Increase default buffer size because default is usually
                             # small (4k is common on Linux).
                             fh = open(filename, "wb", 131072)
                     else:
                         fd, filename = tempfile.mkstemp(prefix="hg-bundle-", suffix=".hg")
                         fh = os.fdopen(fd, pycompat.sysstr("wb"))
                     cleanup = filename
                     for c in chunks:
                         fh.write(c)
                     cleanup = None
                     return filename
                 finally:
                     if fh is not None:
                         fh.close()
                     if cleanup is not None:
                         if filename and vfs:
                             vfs.unlink(cleanup)
                         else:
                             os.unlink(cleanup)
             class cg1unpacker(object):
                 """Unpacker for cg1 changegroup streams.
                 A changegroup unpacker handles the framing of the revision data in
                 the wire format. Most consumers will want to use the apply()
                 method to add the changes from the changegroup to a repository.
                 If you're forwarding a changegroup unmodified to another consumer,
                 use getchunks(), which returns an iterator of changegroup
                 chunks. This is mostly useful for cases where you need to know the
                 data stream has ended by observing the end of the changegroup.
                 deltachunk() is useful only if you're applying delta data. Most
                 consumers should prefer apply() instead.
                 A few other public methods exist. Those are used only for
                 bundlerepo and some debug commands - their use is discouraged.
                 """
                 deltaheader = _CHANGEGROUPV1_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '01'
                 _grouplistcount = 1 # One list of files after the manifests
                 def __init__(self, fh, alg, extras=None):
                     if alg is None:
                         alg = 'UN'
                     if alg not in util.compengines.supportedbundletypes:
                         raise error.Abort(_('unknown stream compression type: %s')
                                          % alg)
                     if alg == 'BZ':
                         alg = '_truncatedBZ'
                     compengine = util.compengines.forbundletype(alg)
                     self._stream = compengine.decompressorreader(fh)
                     self._type = alg
                     self.extras = extras or {}
                     self.callback = None
                 # These methods (compressed, read, seek, tell) all appear to only
                 # be used by bundlerepo, but it's a little hard to tell.
                 def compressed(self):
                     return self._type is not None and self._type != 'UN'
                 def read(self, l):
                     return self._stream.read(l)
                 def seek(self, pos):
                     return self._stream.seek(pos)
                 def tell(self):
                     return self._stream.tell()
                 def close(self):
                     return self._stream.close()
                 def _chunklength(self):
                     d = readexactly(self._stream, 4)
                     l = struct.unpack(">l", d)[0]
                     if l <= 4:
                         if l:
                             raise error.Abort(_("invalid chunk length %d") % l)
                         return 0
                     if self.callback:
                         self.callback()
                     return l - 4
                 def changelogheader(self):
                     """v10 does not have a changelog header chunk"""
                     return {}
                 def manifestheader(self):
                     """v10 does not have a manifest header chunk"""
                     return {}
                 def filelogheader(self):
                     """return the header of the filelogs chunk, v10 only has the filename"""
                     l = self._chunklength()
                     if not l:
                         return {}
                     fname = readexactly(self._stream, l)
                     return {'filename': fname}
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, cs = headertuple
                     if prevnode is None:
                         deltabase = p1
                     else:
                         deltabase = prevnode
                     flags = 0
                     return node, p1, p2, deltabase, cs, flags
                 def deltachunk(self, prevnode):
                     l = self._chunklength()
                     if not l:
                         return {}
                     headerdata = readexactly(self._stream, self.deltaheadersize)
                     header = struct.unpack(self.deltaheader, headerdata)
                     delta = readexactly(self._stream, l - self.deltaheadersize)
                     node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)
                     return {'node': node, 'p1': p1, 'p2': p2, 'cs': cs,
                             'deltabase': deltabase, 'delta': delta, 'flags': flags}
                 def getchunks(self):
                     """returns all the chunks contains in the bundle
                     Used when you need to forward the binary stream to a file or another
                     network API. To do so, it parse the changegroup data, otherwise it will
                     block in case of sshrepo because it don't know the end of the stream.
                     """
                     # For changegroup 1 and 2, we expect 3 parts: changelog, manifestlog,
                     # and a list of filelogs. For changegroup 3, we expect 4 parts:
                     # changelog, manifestlog, a list of tree manifestlogs, and a list of
                     # filelogs.
                     #
                     # Changelog and manifestlog parts are terminated with empty chunks. The
                     # tree and file parts are a list of entry sections. Each entry section
                     # is a series of chunks terminating in an empty chunk. The list of these
                     # entry sections is terminated in yet another empty chunk, so we know
                     # we've reached the end of the tree/file list when we reach an empty
                     # chunk that was proceeded by no non-empty chunks.
                     parts = 0
                     while parts < 2 + self._grouplistcount:
                         noentries = True
                         while True:
                             chunk = getchunk(self)
                             if not chunk:
                                 # The first two empty chunks represent the end of the
                                 # changelog and the manifestlog portions. The remaining
                                 # empty chunks represent either A) the end of individual
                                 # tree or file entries in the file list, or B) the end of
                                 # the entire list. It's the end of the entire list if there
                                 # were no entries (i.e. noentries is True).
                                 if parts < 2:
                                     parts += 1
                                 elif noentries:
                                     parts += 1
                                 break
                             noentries = False
                             yield chunkheader(len(chunk))
                             pos = 0
                             while pos < len(chunk):
                                 next = pos + 2**20
                                 yield chunk[pos:next]
                                 pos = next
                         yield closechunk()
                 def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):
                     # We know that we'll never have more manifests than we had
                     # changesets.
                     self.callback = prog(_('manifests'), numchanges)
                     # no need to check for empty manifest group here:
                     # if the result of the merge of 1 and 2 is the same in 3 and 4,
                     # no new manifest will be created and the manifest group will
                     # be empty during the pull
                     self.manifestheader()
                     deltas = self.deltaiter(revmap)
                     repo.manifestlog._revlog.addgroup(deltas, trp)
                     repo.ui.progress(_('manifests'), None)
                     self.callback = None
                 def apply(self, repo, tr, srctype, url, targetphase=phases.draft,
                           expectedtotal=None):
                     """Add the changegroup returned by source.read() to this repo.
                     srctype is a string like 'push', 'pull', or 'unbundle'.  url is
                     the URL of the repo where this changegroup is coming from.
                     Return an integer summarizing the change to this repo:
                     - nothing changed or no source: 0
                     - more heads than before: 1+added heads (2..n)
                     - fewer heads than before: -1-removed heads (-2..-n)
                     - number of heads stays the same: 1
                     """
                     repo = repo.unfiltered()
                     def csmap(x):
                         repo.ui.debug("add changeset %s\n" % short(x))
                         return len(cl)
                     def revmap(x):
                         return cl.rev(x)
                     changesets = files = revisions = 0
                     try:
                         # The transaction may already carry source information. In this
                         # case we use the top level data. We overwrite the argument
                         # because we need to use the top level value (if they exist)
                         # in this function.
                         srctype = tr.hookargs.setdefault('source', srctype)
                         url = tr.hookargs.setdefault('url', url)
                         repo.hook('prechangegroup',
                                   throw=True, **pycompat.strkwargs(tr.hookargs))
                         # write changelog data to temp files so concurrent readers
                         # will not see an inconsistent view
                         cl = repo.changelog
                         cl.delayupdate(tr)
                         oldheads = set(cl.heads())
                         trp = weakref.proxy(tr)
                         # pull off the changeset group
                         repo.ui.status(_("adding changesets\n"))
                         clstart = len(cl)
                         class prog(object):
                             def __init__(self, step, total):
                                 self._step = step
                                 self._total = total
                                 self._count = 1
                             def __call__(self):
                                 repo.ui.progress(self._step, self._count, unit=_('chunks'),
                                                  total=self._total)
                                 self._count += 1
                         self.callback = prog(_('changesets'), expectedtotal)
                         efiles = set()
                         def onchangelog(cl, node):
                             efiles.update(cl.readfiles(node))
                         self.changelogheader()
                         deltas = self.deltaiter(csmap)
                         cgnodes = cl.addgroup(deltas, trp, addrevisioncb=onchangelog)
                         efiles = len(efiles)
                         if not cgnodes:
                             repo.ui.develwarn('applied empty changegroup',
                                               config='empty-changegroup')
                         clend = len(cl)
                         changesets = clend - clstart
                         repo.ui.progress(_('changesets'), None)
                         self.callback = None
                         # pull off the manifest group
                         repo.ui.status(_("adding manifests\n"))
                         self._unpackmanifests(repo, revmap, trp, prog, changesets)
                         needfiles = {}
                         if repo.ui.configbool('server', 'validate'):
                             cl = repo.changelog
                             ml = repo.manifestlog
                             # validate incoming csets have their manifests
                             for cset in xrange(clstart, clend):
                                 mfnode = cl.changelogrevision(cset).manifest
                                 mfest = ml[mfnode].readdelta()
                                 # store file cgnodes we must see
                                 for f, n in mfest.iteritems():
                                     needfiles.setdefault(f, set()).add(n)
                         # process the files
                         repo.ui.status(_("adding file changes\n"))
                         newrevs, newfiles = _addchangegroupfiles(
                             repo, self, revmap, trp, efiles, needfiles)
                         revisions += newrevs
                         files += newfiles
                         deltaheads = 0
                         if oldheads:
                             heads = cl.heads()
                             deltaheads = len(heads) - len(oldheads)
                             for h in heads:
                                 if h not in oldheads and repo[h].closesbranch():
                                     deltaheads -= 1
                         htext = ""
                         if deltaheads:
                             htext = _(" (%+d heads)") % deltaheads
                         repo.ui.status(_("added %d changesets"
                                          " with %d changes to %d files%s\n")
                                          % (changesets, revisions, files, htext))
                         repo.invalidatevolatilesets()
                         if changesets > 0:
                             if 'node' not in tr.hookargs:
                                 tr.hookargs['node'] = hex(cl.node(clstart))
                                 tr.hookargs['node_last'] = hex(cl.node(clend - 1))
                                 hookargs = dict(tr.hookargs)
                             else:
                                 hookargs = dict(tr.hookargs)
                                 hookargs['node'] = hex(cl.node(clstart))
                                 hookargs['node_last'] = hex(cl.node(clend - 1))
                             repo.hook('pretxnchangegroup',
                                       throw=True, **pycompat.strkwargs(hookargs))
                         added = [cl.node(r) for r in xrange(clstart, clend)]
                         phaseall = None
                         if srctype in ('push', 'serve'):
                             # Old servers can not push the boundary themselves.
                             # New servers won't push the boundary if changeset already
                             # exists locally as secret
                             #
                             # We should not use added here but the list of all change in
                             # the bundle
                             if repo.publishing():
                                 targetphase = phaseall = phases.public
                             else:
                                 # closer target phase computation
                                 # Those changesets have been pushed from the
                                 # outside, their phases are going to be pushed
                                 # alongside. Therefor `targetphase` is
                                 # ignored.
                                 targetphase = phaseall = phases.draft
                         if added:
                             phases.registernew(repo, tr, targetphase, added)
                         if phaseall is not None:
                             phases.advanceboundary(repo, tr, phaseall, cgnodes)
                         if changesets > 0:
                             def runhooks():
                                 # These hooks run when the lock releases, not when the
                                 # transaction closes. So it's possible for the changelog
                                 # to have changed since we last saw it.
                                 if clstart >= len(repo):
                                     return
                                 repo.hook("changegroup", **pycompat.strkwargs(hookargs))
                                 for n in added:
                                     args = hookargs.copy()
                                     args['node'] = hex(n)
                                     del args['node_last']
                                     repo.hook("incoming", **pycompat.strkwargs(args))
                                 newheads = [h for h in repo.heads()
                                             if h not in oldheads]
                                 repo.ui.log("incoming",
                                             "%s incoming changes - new heads: %s\n",
                                             len(added),
                                             ', '.join([hex(c[:6]) for c in newheads]))
                             tr.addpostclose('changegroup-runhooks-%020i' % clstart,
                                             lambda tr: repo._afterlock(runhooks))
                     finally:
                         repo.ui.flush()
                     # never return 0 here:
                     if deltaheads < 0:
                         ret = deltaheads - 1
                     else:
                         ret = deltaheads + 1
                     return ret
                 def deltaiter(self, linkmapper):
                     """
                     returns an iterator of the deltas in this changegroup
                     Useful for passing to the underlying storage system to be stored.
                     """
                     chain = None
                     for chunkdata in iter(lambda: self.deltachunk(chain), {}):
                         node = chunkdata['node']
                         p1 = chunkdata['p1']
                         p2 = chunkdata['p2']
                         cs = chunkdata['cs']
                         deltabase = chunkdata['deltabase']
                         delta = chunkdata['delta']
                         flags = chunkdata['flags']
                         link = linkmapper(cs)
                         chain = node
                         yield (node, p1, p2, link, deltabase, delta, flags)
             class cg2unpacker(cg1unpacker):
                 """Unpacker for cg2 streams.
                 cg2 streams add support for generaldelta, so the delta header
                 format is slightly different. All other features about the data
                 remain the same.
                 """
                 deltaheader = _CHANGEGROUPV2_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '02'
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, deltabase, cs = headertuple
                     flags = 0
                     return node, p1, p2, deltabase, cs, flags
             class cg3unpacker(cg2unpacker):
                 """Unpacker for cg3 streams.
                 cg3 streams add support for exchanging treemanifests and revlog
                 flags. It adds the revlog flags to the delta header and an empty chunk
                 separating manifests and files.
                 """
                 deltaheader = _CHANGEGROUPV3_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '03'
                 _grouplistcount = 2 # One list of manifests and one list of files
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, deltabase, cs, flags = headertuple
                     return node, p1, p2, deltabase, cs, flags
                 def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):
                     super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog,
                                                               numchanges)
                     for chunkdata in iter(self.filelogheader, {}):
                         # If we get here, there are directory manifests in the changegroup
                         d = chunkdata["filename"]
                         repo.ui.debug("adding %s revisions\n" % d)
                         dirlog = repo.manifestlog._revlog.dirlog(d)
                         deltas = self.deltaiter(revmap)
                         if not dirlog.addgroup(deltas, trp):
                             raise error.Abort(_("received dir revlog group is empty"))
             class headerlessfixup(object):
                 def __init__(self, fh, h):
                     self._h = h
                     self._fh = fh
                 def read(self, n):
                     if self._h:
                         d, self._h = self._h[:n], self._h[n:]
                         if len(d) < n:
                             d += readexactly(self._fh, n - len(d))
                         return d
                     return readexactly(self._fh, n)
             class cg1packer(object):
                 deltaheader = _CHANGEGROUPV1_DELTA_HEADER
                 version = '01'
                 def __init__(self, repo, bundlecaps=None):
                     """Given a source repo, construct a bundler.
                     bundlecaps is optional and can be used to specify the set of
                     capabilities which can be used to build the bundle. While bundlecaps is
                     unused in core Mercurial, extensions rely on this feature to communicate
                     capabilities to customize the changegroup packer.
                     """
                     # Set of capabilities we can use to build the bundle.
                     if bundlecaps is None:
                         bundlecaps = set()
                     self._bundlecaps = bundlecaps
                     # experimental config: bundle.reorder
                     reorder = repo.ui.config('bundle', 'reorder')
                     if reorder == 'auto':
                         reorder = None
                     else:
                         reorder = util.parsebool(reorder)
                     self._repo = repo
                     self._reorder = reorder
                     self._progress = repo.ui.progress
                     if self._repo.ui.verbose and not self._repo.ui.debugflag:
                         self._verbosenote = self._repo.ui.note
                     else:
                         self._verbosenote = lambda s: None
                 def close(self):
                     return closechunk()
                 def fileheader(self, fname):
                     return chunkheader(len(fname)) + fname
                 # Extracted both for clarity and for overriding in extensions.
                 def _sortgroup(self, revlog, nodelist, lookup):
                     """Sort nodes for change group and turn them into revnums."""
                     # for generaldelta revlogs, we linearize the revs; this will both be
                     # much quicker and generate a much smaller bundle
                     if (revlog._generaldelta and self._reorder is None) or self._reorder:
                         dag = dagutil.revlogdag(revlog)
                         return dag.linearize(set(revlog.rev(n) for n in nodelist))
                     else:
                         return sorted([revlog.rev(n) for n in nodelist])
                 def group(self, nodelist, revlog, lookup, units=None):
                     """Calculate a delta group, yielding a sequence of changegroup chunks
                     (strings).
                     Given a list of changeset revs, return a set of deltas and
                     metadata corresponding to nodes. The first delta is
                     first parent(nodelist[0]) -> nodelist[0], the receiver is
                     guaranteed to have this parent as it has all history before
                     these changesets. In the case firstparent is nullrev the
                     changegroup starts with a full revision.
                     If units is not None, progress detail will be generated, units specifies
                     the type of revlog that is touched (changelog, manifest, etc.).
                     """
                     # if we don't have any revisions touched by these changesets, bail
                     if len(nodelist) == 0:
                         yield self.close()
                         return
                     revs = self._sortgroup(revlog, nodelist, lookup)
                     # add the parent of the first rev
                     p = revlog.parentrevs(revs[0])[0]
                     revs.insert(0, p)
                     # build deltas
                     total = len(revs) - 1
                     msgbundling = _('bundling')
                     for r in xrange(len(revs) - 1):
                         if units is not None:
                             self._progress(msgbundling, r + 1, unit=units, total=total)
                         prev, curr = revs[r], revs[r + 1]
                         linknode = lookup(revlog.node(curr))
                         for c in self.revchunk(revlog, curr, prev, linknode):
                             yield c
                     if units is not None:
                         self._progress(msgbundling, None)
                     yield self.close()
                 # filter any nodes that claim to be part of the known set
                 def prune(self, revlog, missing, commonrevs):
                     rr, rl = revlog.rev, revlog.linkrev
                     return [n for n in missing if rl(rr(n)) not in commonrevs]
                 def _packmanifests(self, dir, mfnodes, lookuplinknode):
                     """Pack flat manifests into a changegroup stream."""
                     assert not dir
                     for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,
                                             lookuplinknode, units=_('manifests')):
                         yield chunk
                 def _manifestsdone(self):
                     return ''
                 def generate(self, commonrevs, clnodes, fastpathlinkrev, source):
                     '''yield a sequence of changegroup chunks (strings)'''
                     repo = self._repo
                     cl = repo.changelog
                     clrevorder = {}
                     mfs = {} # needed manifests
                     fnodes = {} # needed file nodes
                     changedfiles = set()
                     # Callback for the changelog, used to collect changed files and manifest
                     # nodes.
                     # Returns the linkrev node (identity in the changelog case).
                     def lookupcl(x):
                         c = cl.read(x)
                         clrevorder[x] = len(clrevorder)
                         n = c[0]
                         # record the first changeset introducing this manifest version
                         mfs.setdefault(n, x)
                         # Record a complete list of potentially-changed files in
                         # this manifest.
                         changedfiles.update(c[3])
                         return x
                     self._verbosenote(_('uncompressed size of bundle content:\n'))
                     size = 0
                     for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):
                         size += len(chunk)
                         yield chunk
                     self._verbosenote(_('%8.i (changelog)\n') % size)
                     # We need to make sure that the linkrev in the changegroup refers to
                     # the first changeset that introduced the manifest or file revision.
                     # The fastpath is usually safer than the slowpath, because the filelogs
                     # are walked in revlog order.
                     #
                     # When taking the slowpath with reorder=None and the manifest revlog
                     # uses generaldelta, the manifest may be walked in the "wrong" order.
                     # Without 'clrevorder', we would get an incorrect linkrev (see fix in
                     # cc0ff93d0c0c).
                     #
                     # When taking the fastpath, we are only vulnerable to reordering
                     # of the changelog itself. The changelog never uses generaldelta, so
                     # it is only reordered when reorder=True. To handle this case, we
                     # simply take the slowpath, which already has the 'clrevorder' logic.
                     # This was also fixed in cc0ff93d0c0c.
                     fastpathlinkrev = fastpathlinkrev and not self._reorder
                     # Treemanifests don't work correctly with fastpathlinkrev
                     # either, because we don't discover which directory nodes to
                     # send along with files. This could probably be fixed.
                     fastpathlinkrev = fastpathlinkrev and (
                         'treemanifest' not in repo.requirements)
                     for chunk in self.generatemanifests(commonrevs, clrevorder,
-                            fastpathlinkrev, mfs, fnodes):
+                            fastpathlinkrev, mfs, fnodes, source):
                         yield chunk
                     mfs.clear()
                     clrevs = set(cl.rev(x) for x in clnodes)
                     if not fastpathlinkrev:
                         def linknodes(unused, fname):
                             return fnodes.get(fname, {})
                     else:
                         cln = cl.node
                         def linknodes(filerevlog, fname):
                             llr = filerevlog.linkrev
                             fln = filerevlog.node
                             revs = ((r, llr(r)) for r in filerevlog)
                             return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)
                     for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,
                                                     source):
                         yield chunk
                     yield self.close()
                     if clnodes:
                         repo.hook('outgoing', node=hex(clnodes[0]), source=source)
                 def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,
-                                      fnodes):
+                                      fnodes, source):
+                    """Returns an iterator of changegroup chunks containing manifests.
+                    `source` is unused here, but is used by extensions like remotefilelog to
+                    change what is sent based in pulls vs pushes, etc.
+                    """
                     repo = self._repo
                     mfl = repo.manifestlog
                     dirlog = mfl._revlog.dirlog
                     tmfnodes = {'': mfs}
                     # Callback for the manifest, used to collect linkrevs for filelog
                     # revisions.
                     # Returns the linkrev node (collected in lookupcl).
                     def makelookupmflinknode(dir):
                         if fastpathlinkrev:
                             assert not dir
                             return mfs.__getitem__
                         def lookupmflinknode(x):
                             """Callback for looking up the linknode for manifests.
                             Returns the linkrev node for the specified manifest.
                             SIDE EFFECT:
 ) fclnodes gets populated with the list of relevant
                                file nodes if we're not using fastpathlinkrev
 ) When treemanifests are in use, collects treemanifest nodes
                                to send
                             Note that this means manifests must be completely sent to
                             the client before you can trust the list of files and
                             treemanifests to send.
                             """
                             clnode = tmfnodes[dir][x]
                             mdata = mfl.get(dir, x).readfast(shallow=True)
                             for p, n, fl in mdata.iterentries():
                                 if fl == 't': # subdirectory manifest
                                     subdir = dir + p + '/'
                                     tmfclnodes = tmfnodes.setdefault(subdir, {})
                                     tmfclnode = tmfclnodes.setdefault(n, clnode)
                                     if clrevorder[clnode] < clrevorder[tmfclnode]:
                                         tmfclnodes[n] = clnode
                                 else:
                                     f = dir + p
                                     fclnodes = fnodes.setdefault(f, {})
                                     fclnode = fclnodes.setdefault(n, clnode)
                                     if clrevorder[clnode] < clrevorder[fclnode]:
                                         fclnodes[n] = clnode
                             return clnode
                         return lookupmflinknode
                     size = 0
                     while tmfnodes:
                         dir = min(tmfnodes)
                         nodes = tmfnodes[dir]
                         prunednodes = self.prune(dirlog(dir), nodes, commonrevs)
                         if not dir or prunednodes:
                             for x in self._packmanifests(dir, prunednodes,
                                                          makelookupmflinknode(dir)):
                                 size += len(x)
                                 yield x
                         del tmfnodes[dir]
                     self._verbosenote(_('%8.i (manifests)\n') % size)
                     yield self._manifestsdone()
                 # The 'source' parameter is useful for extensions
                 def generatefiles(self, changedfiles, linknodes, commonrevs, source):
                     repo = self._repo
                     progress = self._progress
                     msgbundling = _('bundling')
                     total = len(changedfiles)
                     # for progress output
                     msgfiles = _('files')
                     for i, fname in enumerate(sorted(changedfiles)):
                         filerevlog = repo.file(fname)
                         if not filerevlog:
                             raise error.Abort(_("empty or missing revlog for %s") % fname)
                         linkrevnodes = linknodes(filerevlog, fname)
                         # Lookup for filenodes, we collected the linkrev nodes above in the
                         # fastpath case and with lookupmf in the slowpath case.
                         def lookupfilelog(x):
                             return linkrevnodes[x]
                         filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)
                         if filenodes:
                             progress(msgbundling, i + 1, item=fname, unit=msgfiles,
                                      total=total)
                             h = self.fileheader(fname)
                             size = len(h)
                             yield h
                             for chunk in self.group(filenodes, filerevlog, lookupfilelog):
                                 size += len(chunk)
                                 yield chunk
                             self._verbosenote(_('%8.i  %s\n') % (size, fname))
                     progress(msgbundling, None)
                 def deltaparent(self, revlog, rev, p1, p2, prev):
                     return prev
                 def revchunk(self, revlog, rev, prev, linknode):
                     node = revlog.node(rev)
                     p1, p2 = revlog.parentrevs(rev)
                     base = self.deltaparent(revlog, rev, p1, p2, prev)
                     prefix = ''
                     if revlog.iscensored(base) or revlog.iscensored(rev):
                         try:
                             delta = revlog.revision(node, raw=True)
                         except error.CensoredNodeError as e:
                             delta = e.tombstone
                         if base == nullrev:
                             prefix = mdiff.trivialdiffheader(len(delta))
                         else:
                             baselen = revlog.rawsize(base)
                             prefix = mdiff.replacediffheader(baselen, len(delta))
                     elif base == nullrev:
                         delta = revlog.revision(node, raw=True)
                         prefix = mdiff.trivialdiffheader(len(delta))
                     else:
                         delta = revlog.revdiff(base, rev)
                     p1n, p2n = revlog.parents(node)
                     basenode = revlog.node(base)
                     flags = revlog.flags(rev)
                     meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)
                     meta += prefix
                     l = len(meta) + len(delta)
                     yield chunkheader(l)
                     yield meta
                     yield delta
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     # do nothing with basenode, it is implicitly the previous one in HG10
                     # do nothing with flags, it is implicitly 0 for cg1 and cg2
                     return struct.pack(self.deltaheader, node, p1n, p2n, linknode)
             class cg2packer(cg1packer):
                 version = '02'
                 deltaheader = _CHANGEGROUPV2_DELTA_HEADER
                 def __init__(self, repo, bundlecaps=None):
                     super(cg2packer, self).__init__(repo, bundlecaps)
                     if self._reorder is None:
                         # Since generaldelta is directly supported by cg2, reordering
                         # generally doesn't help, so we disable it by default (treating
                         # bundle.reorder=auto just like bundle.reorder=False).
                         self._reorder = False
                 def deltaparent(self, revlog, rev, p1, p2, prev):
                     dp = revlog.deltaparent(rev)
                     if dp == nullrev and revlog.storedeltachains:
                         # Avoid sending full revisions when delta parent is null. Pick prev
                         # in that case. It's tempting to pick p1 in this case, as p1 will
                         # be smaller in the common case. However, computing a delta against
                         # p1 may require resolving the raw text of p1, which could be
                         # expensive. The revlog caches should have prev cached, meaning
                         # less CPU for changegroup generation. There is likely room to add
                         # a flag and/or config option to control this behavior.
                         return prev
                     elif dp == nullrev:
                         # revlog is configured to use full snapshot for a reason,
                         # stick to full snapshot.
                         return nullrev
                     elif dp not in (p1, p2, prev):
                         # Pick prev when we can't be sure remote has the base revision.
                         return prev
                     else:
                         return dp
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     # Do nothing with flags, it is implicitly 0 in cg1 and cg2
                     return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)
             class cg3packer(cg2packer):
                 version = '03'
                 deltaheader = _CHANGEGROUPV3_DELTA_HEADER
                 def _packmanifests(self, dir, mfnodes, lookuplinknode):
                     if dir:
                         yield self.fileheader(dir)
                     dirlog = self._repo.manifestlog._revlog.dirlog(dir)
                     for chunk in self.group(mfnodes, dirlog, lookuplinknode,
                                             units=_('manifests')):
                         yield chunk
                 def _manifestsdone(self):
                     return self.close()
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     return struct.pack(
                         self.deltaheader, node, p1n, p2n, basenode, linknode, flags)
             _packermap = {'01': (cg1packer, cg1unpacker),
                          # cg2 adds support for exchanging generaldelta
                          '02': (cg2packer, cg2unpacker),
                          # cg3 adds support for exchanging revlog flags and treemanifests
                          '03': (cg3packer, cg3unpacker),
             }
             def allsupportedversions(repo):
                 versions = set(_packermap.keys())
                 if not (repo.ui.configbool('experimental', 'changegroup3') or
                         repo.ui.configbool('experimental', 'treemanifest') or
                         'treemanifest' in repo.requirements):
                     versions.discard('03')
                 return versions
             # Changegroup versions that can be applied to the repo
             def supportedincomingversions(repo):
                 return allsupportedversions(repo)
             # Changegroup versions that can be created from the repo
             def supportedoutgoingversions(repo):
                 versions = allsupportedversions(repo)
                 if 'treemanifest' in repo.requirements:
                     # Versions 01 and 02 support only flat manifests and it's just too
                     # expensive to convert between the flat manifest and tree manifest on
                     # the fly. Since tree manifests are hashed differently, all of history
                     # would have to be converted. Instead, we simply don't even pretend to
                     # support versions 01 and 02.
                     versions.discard('01')
                     versions.discard('02')
                 return versions
             def safeversion(repo):
                 # Finds the smallest version that it's safe to assume clients of the repo
                 # will support. For example, all hg versions that support generaldelta also
                 # support changegroup 02.
                 versions = supportedoutgoingversions(repo)
                 if 'generaldelta' in repo.requirements:
                     versions.discard('01')
                 assert versions
                 return min(versions)
             def getbundler(version, repo, bundlecaps=None):
                 assert version in supportedoutgoingversions(repo)
                 return _packermap[version][0](repo, bundlecaps)
             def getunbundler(version, fh, alg, extras=None):
                 return _packermap[version][1](fh, alg, extras=extras)
             def _changegroupinfo(repo, nodes, source):
                 if repo.ui.verbose or source == 'bundle':
                     repo.ui.status(_("%d changesets found\n") % len(nodes))
                 if repo.ui.debugflag:
                     repo.ui.debug("list of changesets:\n")
                     for node in nodes:
                         repo.ui.debug("%s\n" % hex(node))
             def makechangegroup(repo, outgoing, version, source, fastpath=False,
                                 bundlecaps=None):
                 cgstream = makestream(repo, outgoing, version, source,
                                       fastpath=fastpath, bundlecaps=bundlecaps)
                 return getunbundler(version, util.chunkbuffer(cgstream), None,
                                     {'clcount': len(outgoing.missing) })
             def makestream(repo, outgoing, version, source, fastpath=False,
                            bundlecaps=None):
                 bundler = getbundler(version, repo, bundlecaps=bundlecaps)
                 repo = repo.unfiltered()
                 commonrevs = outgoing.common
                 csets = outgoing.missing
                 heads = outgoing.missingheads
                 # We go through the fast path if we get told to, or if all (unfiltered
                 # heads have been requested (since we then know there all linkrevs will
                 # be pulled by the client).
                 heads.sort()
                 fastpathlinkrev = fastpath or (
                         repo.filtername is None and heads == sorted(repo.heads()))
                 repo.hook('preoutgoing', throw=True, source=source)
                 _changegroupinfo(repo, csets, source)
                 return bundler.generate(commonrevs, csets, fastpathlinkrev, source)
             def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):
                 revisions = 0
                 files = 0
                 for chunkdata in iter(source.filelogheader, {}):
                     files += 1
                     f = chunkdata["filename"]
                     repo.ui.debug("adding %s revisions\n" % f)
                     repo.ui.progress(_('files'), files, unit=_('files'),
                                      total=expectedfiles)
                     fl = repo.file(f)
                     o = len(fl)
                     try:
                         deltas = source.deltaiter(revmap)
                         if not fl.addgroup(deltas, trp):
                             raise error.Abort(_("received file revlog group is empty"))
                     except error.CensoredBaseError as e:
                         raise error.Abort(_("received delta base is censored: %s") % e)
                     revisions += len(fl) - o
                     if f in needfiles:
                         needs = needfiles[f]
                         for new in xrange(o, len(fl)):
                             n = fl.node(new)
                             if n in needs:
                                 needs.remove(n)
                             else:
                                 raise error.Abort(
                                     _("received spurious file revlog entry"))
                         if not needs:
                             del needfiles[f]
                 repo.ui.progress(_('files'), None)
                 for f, needs in needfiles.iteritems():
                     fl = repo.file(f)
                     for n in needs:
                         try:
                             fl.rev(n)
                         except error.LookupError:
                             raise error.Abort(
                                 _('missing file data for %s:%s - run hg verify') %
                                 (f, hex(n)))
                 return revisions, files