upstream/mercurial-mirror Commit - r38401:daa08d45

1

# changegroup.py - Mercurial changegroup manipulation functions

1

# changegroup.py - Mercurial changegroup manipulation functions

2

#

2

#

3

4

#

4

#

5

# This software may be used and distributed according to the terms of the

5

# This software may be used and distributed according to the terms of the

6

# GNU General Public License version 2 or any later version.

6

# GNU General Public License version 2 or any later version.

7

8

from __future__ import absolute_import

8

from __future__ import absolute_import

9

10

import os

10

import os

11

import struct

11

import struct

12

import weakref

12

import weakref

13

14

from .i18n import _

14

from .i18n import _

15

from .node import (

15

from .node import (

16

hex,

16

hex,

17

nullrev,

17

nullrev,

18

short,

18

short,

19

)

19

)

20

21

from . import (

21

from . import (

22

dagutil,

22

dagutil,

23

error,

23

error,

24

mdiff,

24

mdiff,

25

phases,

25

phases,

26

pycompat,

26

pycompat,

27

util,

27

util,

28

)

28

)

29

30

from .utils import (

30

from .utils import (

31

stringutil,

31

stringutil,

32

)

32

)

33

34

_CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"

34

_CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"

35

_CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"

35

_CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"

36

_CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"

36

_CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"

37

38

LFS_REQUIREMENT = 'lfs'

38

LFS_REQUIREMENT = 'lfs'

39

40

# When narrowing is finalized and no longer subject to format changes,

40

# When narrowing is finalized and no longer subject to format changes,

41

# we should move this to just "narrow" or similar.

41

# we should move this to just "narrow" or similar.

42

NARROW_REQUIREMENT = 'narrowhg-experimental'

42

NARROW_REQUIREMENT = 'narrowhg-experimental'

43

44

readexactly = util.readexactly

44

readexactly = util.readexactly

45

46

def getchunk(stream):

46

def getchunk(stream):

47

"""return the next chunk from stream as a string"""

47

"""return the next chunk from stream as a string"""

48

d = readexactly(stream, 4)

48

d = readexactly(stream, 4)

49

l = struct.unpack(">l", d)[0]

49

l = struct.unpack(">l", d)[0]

50

if l <= 4:

50

if l <= 4:

51

if l:

51

if l:

52

raise error.Abort(_("invalid chunk length %d") % l)

52

raise error.Abort(_("invalid chunk length %d") % l)

53

return ""

53

return ""

54

return readexactly(stream, l - 4)

54

return readexactly(stream, l - 4)

55

56

def chunkheader(length):

56

def chunkheader(length):

57

"""return a changegroup chunk header (string)"""

57

"""return a changegroup chunk header (string)"""

58

return struct.pack(">l", length + 4)

58

return struct.pack(">l", length + 4)

59

60

def closechunk():

60

def closechunk():

61

"""return a changegroup chunk header (string) for a zero-length chunk"""

61

"""return a changegroup chunk header (string) for a zero-length chunk"""

62

return struct.pack(">l", 0)

62

return struct.pack(">l", 0)

63

64

def writechunks(ui, chunks, filename, vfs=None):

64

def writechunks(ui, chunks, filename, vfs=None):

65

"""Write chunks to a file and return its filename.

65

"""Write chunks to a file and return its filename.

66

67

The stream is assumed to be a bundle file.

67

The stream is assumed to be a bundle file.

68

Existing files will not be overwritten.

68

Existing files will not be overwritten.

69

If no filename is specified, a temporary file is created.

69

If no filename is specified, a temporary file is created.

70

"""

70

"""

71

fh = None

71

fh = None

72

cleanup = None

72

cleanup = None

73

try:

73

try:

74

if filename:

74

if filename:

75

if vfs:

75

if vfs:

76

fh = vfs.open(filename, "wb")

76

fh = vfs.open(filename, "wb")

77

else:

77

else:

78

# Increase default buffer size because default is usually

78

# Increase default buffer size because default is usually

79

# small (4k is common on Linux).

79

# small (4k is common on Linux).

80

fh = open(filename, "wb", 131072)

80

fh = open(filename, "wb", 131072)

81

else:

81

else:

82

fd, filename = pycompat.mkstemp(prefix="hg-bundle-", suffix=".hg")

82

fd, filename = pycompat.mkstemp(prefix="hg-bundle-", suffix=".hg")

83

fh = os.fdopen(fd, r"wb")

83

fh = os.fdopen(fd, r"wb")

84

cleanup = filename

84

cleanup = filename

85

for c in chunks:

85

for c in chunks:

86

fh.write(c)

86

fh.write(c)

87

cleanup = None

87

cleanup = None

88

return filename

88

return filename

89

finally:

89

finally:

90

if fh is not None:

90

if fh is not None:

91

fh.close()

91

fh.close()

92

if cleanup is not None:

92

if cleanup is not None:

93

if filename and vfs:

93

if filename and vfs:

94

vfs.unlink(cleanup)

94

vfs.unlink(cleanup)

95

else:

95

else:

96

os.unlink(cleanup)

96

os.unlink(cleanup)

97

98

class cg1unpacker(object):

98

class cg1unpacker(object):

99

"""Unpacker for cg1 changegroup streams.

99

"""Unpacker for cg1 changegroup streams.

100

101

A changegroup unpacker handles the framing of the revision data in

101

A changegroup unpacker handles the framing of the revision data in

102

the wire format. Most consumers will want to use the apply()

102

the wire format. Most consumers will want to use the apply()

103

method to add the changes from the changegroup to a repository.

103

method to add the changes from the changegroup to a repository.

104

105

If you're forwarding a changegroup unmodified to another consumer,

105

If you're forwarding a changegroup unmodified to another consumer,

106

use getchunks(), which returns an iterator of changegroup

106

use getchunks(), which returns an iterator of changegroup

107

chunks. This is mostly useful for cases where you need to know the

107

chunks. This is mostly useful for cases where you need to know the

108

data stream has ended by observing the end of the changegroup.

108

data stream has ended by observing the end of the changegroup.

109

110

deltachunk() is useful only if you're applying delta data. Most

110

deltachunk() is useful only if you're applying delta data. Most

111

consumers should prefer apply() instead.

111

consumers should prefer apply() instead.

112

113

A few other public methods exist. Those are used only for

113

A few other public methods exist. Those are used only for

114

bundlerepo and some debug commands - their use is discouraged.

114

bundlerepo and some debug commands - their use is discouraged.

115

"""

115

"""

116

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

116

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

117

deltaheadersize = struct.calcsize(deltaheader)

117

deltaheadersize = struct.calcsize(deltaheader)

118

version = '01'

118

version = '01'

119

_grouplistcount = 1 # One list of files after the manifests

119

_grouplistcount = 1 # One list of files after the manifests

120

121

def __init__(self, fh, alg, extras=None):

121

def __init__(self, fh, alg, extras=None):

122

if alg is None:

122

if alg is None:

123

alg = 'UN'

123

alg = 'UN'

124

if alg not in util.compengines.supportedbundletypes:

124

if alg not in util.compengines.supportedbundletypes:

125

raise error.Abort(_('unknown stream compression type: %s')

125

raise error.Abort(_('unknown stream compression type: %s')

126

% alg)

126

% alg)

127

if alg == 'BZ':

127

if alg == 'BZ':

128

alg = '_truncatedBZ'

128

alg = '_truncatedBZ'

129

130

compengine = util.compengines.forbundletype(alg)

130

compengine = util.compengines.forbundletype(alg)

131

self._stream = compengine.decompressorreader(fh)

131

self._stream = compengine.decompressorreader(fh)

132

self._type = alg

132

self._type = alg

133

self.extras = extras or {}

133

self.extras = extras or {}

134

self.callback = None

134

self.callback = None

135

136

# These methods (compressed, read, seek, tell) all appear to only

136

# These methods (compressed, read, seek, tell) all appear to only

137

# be used by bundlerepo, but it's a little hard to tell.

137

# be used by bundlerepo, but it's a little hard to tell.

138

def compressed(self):

138

def compressed(self):

139

return self._type is not None and self._type != 'UN'

139

return self._type is not None and self._type != 'UN'

140

def read(self, l):

140

def read(self, l):

141

return self._stream.read(l)

141

return self._stream.read(l)

142

def seek(self, pos):

142

def seek(self, pos):

143

return self._stream.seek(pos)

143

return self._stream.seek(pos)

144

def tell(self):

144

def tell(self):

145

return self._stream.tell()

145

return self._stream.tell()

146

def close(self):

146

def close(self):

147

return self._stream.close()

147

return self._stream.close()

148

149

def _chunklength(self):

149

def _chunklength(self):

150

d = readexactly(self._stream, 4)

150

d = readexactly(self._stream, 4)

151

l = struct.unpack(">l", d)[0]

151

l = struct.unpack(">l", d)[0]

152

if l <= 4:

152

if l <= 4:

153

if l:

153

if l:

154

raise error.Abort(_("invalid chunk length %d") % l)

154

raise error.Abort(_("invalid chunk length %d") % l)

155

return 0

155

return 0

156

if self.callback:

156

if self.callback:

157

self.callback()

157

self.callback()

158

return l - 4

158

return l - 4

159

160

def changelogheader(self):

160

def changelogheader(self):

161

"""v10 does not have a changelog header chunk"""

161

"""v10 does not have a changelog header chunk"""

162

return {}

162

return {}

163

164

def manifestheader(self):

164

def manifestheader(self):

165

"""v10 does not have a manifest header chunk"""

165

"""v10 does not have a manifest header chunk"""

166

return {}

166

return {}

167

168

def filelogheader(self):

168

def filelogheader(self):

169

"""return the header of the filelogs chunk, v10 only has the filename"""

169

"""return the header of the filelogs chunk, v10 only has the filename"""

170

l = self._chunklength()

170

l = self._chunklength()

171

if not l:

171

if not l:

172

return {}

172

return {}

173

fname = readexactly(self._stream, l)

173

fname = readexactly(self._stream, l)

174

return {'filename': fname}

174

return {'filename': fname}

175

176

def _deltaheader(self, headertuple, prevnode):

176

def _deltaheader(self, headertuple, prevnode):

177

node, p1, p2, cs = headertuple

177

node, p1, p2, cs = headertuple

178

if prevnode is None:

178

if prevnode is None:

179

deltabase = p1

179

deltabase = p1

180

else:

180

else:

181

deltabase = prevnode

181

deltabase = prevnode

182

flags = 0

182

flags = 0

183

return node, p1, p2, deltabase, cs, flags

183

return node, p1, p2, deltabase, cs, flags

184

185

def deltachunk(self, prevnode):

185

def deltachunk(self, prevnode):

186

l = self._chunklength()

186

l = self._chunklength()

187

if not l:

187

if not l:

188

return {}

188

return {}

189

headerdata = readexactly(self._stream, self.deltaheadersize)

189

headerdata = readexactly(self._stream, self.deltaheadersize)

190

header = struct.unpack(self.deltaheader, headerdata)

190

header = struct.unpack(self.deltaheader, headerdata)

191

delta = readexactly(self._stream, l - self.deltaheadersize)

191

delta = readexactly(self._stream, l - self.deltaheadersize)

192

node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)

192

node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)

193

return (node, p1, p2, cs, deltabase, delta, flags)

193

return (node, p1, p2, cs, deltabase, delta, flags)

194

195

def getchunks(self):

195

def getchunks(self):

196

"""returns all the chunks contains in the bundle

196

"""returns all the chunks contains in the bundle

197

198

Used when you need to forward the binary stream to a file or another

198

Used when you need to forward the binary stream to a file or another

199

network API. To do so, it parse the changegroup data, otherwise it will

199

network API. To do so, it parse the changegroup data, otherwise it will

200

block in case of sshrepo because it don't know the end of the stream.

200

block in case of sshrepo because it don't know the end of the stream.

201

"""

201

"""

202

# For changegroup 1 and 2, we expect 3 parts: changelog, manifestlog,

202

# For changegroup 1 and 2, we expect 3 parts: changelog, manifestlog,

203

# and a list of filelogs. For changegroup 3, we expect 4 parts:

203

# and a list of filelogs. For changegroup 3, we expect 4 parts:

204

# changelog, manifestlog, a list of tree manifestlogs, and a list of

204

# changelog, manifestlog, a list of tree manifestlogs, and a list of

205

# filelogs.

205

# filelogs.

206

#

206

#

207

# Changelog and manifestlog parts are terminated with empty chunks. The

207

# Changelog and manifestlog parts are terminated with empty chunks. The

208

# tree and file parts are a list of entry sections. Each entry section

208

# tree and file parts are a list of entry sections. Each entry section

209

# is a series of chunks terminating in an empty chunk. The list of these

209

# is a series of chunks terminating in an empty chunk. The list of these

210

# entry sections is terminated in yet another empty chunk, so we know

210

# entry sections is terminated in yet another empty chunk, so we know

211

# we've reached the end of the tree/file list when we reach an empty

211

# we've reached the end of the tree/file list when we reach an empty

212

# chunk that was proceeded by no non-empty chunks.

212

# chunk that was proceeded by no non-empty chunks.

213

214

parts = 0

214

parts = 0

215

while parts < 2 + self._grouplistcount:

215

while parts < 2 + self._grouplistcount:

216

noentries = True

216

noentries = True

217

while True:

217

while True:

218

chunk = getchunk(self)

218

chunk = getchunk(self)

219

if not chunk:

219

if not chunk:

220

# The first two empty chunks represent the end of the

220

# The first two empty chunks represent the end of the

221

# changelog and the manifestlog portions. The remaining

221

# changelog and the manifestlog portions. The remaining

222

# empty chunks represent either A) the end of individual

222

# empty chunks represent either A) the end of individual

223

# tree or file entries in the file list, or B) the end of

223

# tree or file entries in the file list, or B) the end of

224

# the entire list. It's the end of the entire list if there

224

# the entire list. It's the end of the entire list if there

225

# were no entries (i.e. noentries is True).

225

# were no entries (i.e. noentries is True).

226

if parts < 2:

226

if parts < 2:

227

parts += 1

227

parts += 1

228

elif noentries:

228

elif noentries:

229

parts += 1

229

parts += 1

230

break

230

break

231

noentries = False

231

noentries = False

232

yield chunkheader(len(chunk))

232

yield chunkheader(len(chunk))

233

pos = 0

233

pos = 0

234

while pos < len(chunk):

234

while pos < len(chunk):

235

next = pos + 2**20

235

next = pos + 2**20

236

yield chunk[pos:next]

236

yield chunk[pos:next]

237

pos = next

237

pos = next

238

yield closechunk()

238

yield closechunk()

239

240

def _unpackmanifests(self, repo, revmap, trp, prog):

240

def _unpackmanifests(self, repo, revmap, trp, prog):

241

self.callback = prog.increment

241

self.callback = prog.increment

242

# no need to check for empty manifest group here:

242

# no need to check for empty manifest group here:

243

# if the result of the merge of 1 and 2 is the same in 3 and 4,

243

# if the result of the merge of 1 and 2 is the same in 3 and 4,

244

# no new manifest will be created and the manifest group will

244

# no new manifest will be created and the manifest group will

245

# be empty during the pull

245

# be empty during the pull

246

self.manifestheader()

246

self.manifestheader()

247

deltas = self.deltaiter()

247

deltas = self.deltaiter()

248

repo.manifestlog._revlog.addgroup(deltas, revmap, trp)

248

repo.manifestlog._revlog.addgroup(deltas, revmap, trp)

249

prog.complete()

249

prog.complete()

250

self.callback = None

250

self.callback = None

251

252

def apply(self, repo, tr, srctype, url, targetphase=phases.draft,

252

def apply(self, repo, tr, srctype, url, targetphase=phases.draft,

253

expectedtotal=None):

253

expectedtotal=None):

254

"""Add the changegroup returned by source.read() to this repo.

254

"""Add the changegroup returned by source.read() to this repo.

255

srctype is a string like 'push', 'pull', or 'unbundle'. url is

255

srctype is a string like 'push', 'pull', or 'unbundle'. url is

256

the URL of the repo where this changegroup is coming from.

256

the URL of the repo where this changegroup is coming from.

257

258

Return an integer summarizing the change to this repo:

258

Return an integer summarizing the change to this repo:

259

- nothing changed or no source: 0

259

- nothing changed or no source: 0

260

- more heads than before: 1+added heads (2..n)

260

- more heads than before: 1+added heads (2..n)

261

- fewer heads than before: -1-removed heads (-2..-n)

261

- fewer heads than before: -1-removed heads (-2..-n)

262

- number of heads stays the same: 1

262

- number of heads stays the same: 1

263

"""

263

"""

264

repo = repo.unfiltered()

264

repo = repo.unfiltered()

265

def csmap(x):

265

def csmap(x):

266

repo.ui.debug("add changeset %s\n" % short(x))

266

repo.ui.debug("add changeset %s\n" % short(x))

267

return len(cl)

267

return len(cl)

268

269

def revmap(x):

269

def revmap(x):

270

return cl.rev(x)

270

return cl.rev(x)

271

272

changesets = files = revisions = 0

272

changesets = files = revisions = 0

273

274

try:

274

try:

275

# The transaction may already carry source information. In this

275

# The transaction may already carry source information. In this

276

# case we use the top level data. We overwrite the argument

276

# case we use the top level data. We overwrite the argument

277

# because we need to use the top level value (if they exist)

277

# because we need to use the top level value (if they exist)

278

# in this function.

278

# in this function.

279

srctype = tr.hookargs.setdefault('source', srctype)

279

srctype = tr.hookargs.setdefault('source', srctype)

280

url = tr.hookargs.setdefault('url', url)

280

url = tr.hookargs.setdefault('url', url)

281

repo.hook('prechangegroup',

281

repo.hook('prechangegroup',

282

throw=True, **pycompat.strkwargs(tr.hookargs))

282

throw=True, **pycompat.strkwargs(tr.hookargs))

283

284

# write changelog data to temp files so concurrent readers

284

# write changelog data to temp files so concurrent readers

285

# will not see an inconsistent view

285

# will not see an inconsistent view

286

cl = repo.changelog

286

cl = repo.changelog

287

cl.delayupdate(tr)

287

cl.delayupdate(tr)

288

oldheads = set(cl.heads())

288

oldheads = set(cl.heads())

289

290

trp = weakref.proxy(tr)

290

trp = weakref.proxy(tr)

291

# pull off the changeset group

291

# pull off the changeset group

292

repo.ui.status(_("adding changesets\n"))

292

repo.ui.status(_("adding changesets\n"))

293

clstart = len(cl)

293

clstart = len(cl)

294

progress = repo.ui.makeprogress(_('changesets'), unit=_('chunks'),

294

progress = repo.ui.makeprogress(_('changesets'), unit=_('chunks'),

295

total=expectedtotal)

295

total=expectedtotal)

296

self.callback = progress.increment

296

self.callback = progress.increment

297

298

efiles = set()

298

efiles = set()

299

def onchangelog(cl, node):

299

def onchangelog(cl, node):

300

efiles.update(cl.readfiles(node))

300

efiles.update(cl.readfiles(node))

301

302

self.changelogheader()

302

self.changelogheader()

303

deltas = self.deltaiter()

303

deltas = self.deltaiter()

304

cgnodes = cl.addgroup(deltas, csmap, trp, addrevisioncb=onchangelog)

304

cgnodes = cl.addgroup(deltas, csmap, trp, addrevisioncb=onchangelog)

305

efiles = len(efiles)

305

efiles = len(efiles)

306

307

if not cgnodes:

307

if not cgnodes:

308

repo.ui.develwarn('applied empty changegroup',

308

repo.ui.develwarn('applied empty changegroup',

309

config='warn-empty-changegroup')

309

config='warn-empty-changegroup')

310

clend = len(cl)

310

clend = len(cl)

311

changesets = clend - clstart

311

changesets = clend - clstart

312

progress.complete()

312

progress.complete()

313

self.callback = None

313

self.callback = None

314

315

# pull off the manifest group

315

# pull off the manifest group

316

repo.ui.status(_("adding manifests\n"))

316

repo.ui.status(_("adding manifests\n"))

317

# We know that we'll never have more manifests than we had

317

# We know that we'll never have more manifests than we had

318

# changesets.

318

# changesets.

319

progress = repo.ui.makeprogress(_('manifests'), unit=_('chunks'),

319

progress = repo.ui.makeprogress(_('manifests'), unit=_('chunks'),

320

total=changesets)

320

total=changesets)

321

self._unpackmanifests(repo, revmap, trp, progress)

321

self._unpackmanifests(repo, revmap, trp, progress)

322

323

needfiles = {}

323

needfiles = {}

324

if repo.ui.configbool('server', 'validate'):

324

if repo.ui.configbool('server', 'validate'):

325

cl = repo.changelog

325

cl = repo.changelog

326

ml = repo.manifestlog

326

ml = repo.manifestlog

327

# validate incoming csets have their manifests

327

# validate incoming csets have their manifests

328

for cset in xrange(clstart, clend):

328

for cset in xrange(clstart, clend):

329

mfnode = cl.changelogrevision(cset).manifest

329

mfnode = cl.changelogrevision(cset).manifest

330

mfest = ml[mfnode].readdelta()

330

mfest = ml[mfnode].readdelta()

331

# store file cgnodes we must see

331

# store file cgnodes we must see

332

for f, n in mfest.iteritems():

332

for f, n in mfest.iteritems():

333

needfiles.setdefault(f, set()).add(n)

333

needfiles.setdefault(f, set()).add(n)

334

335

# process the files

335

# process the files

336

repo.ui.status(_("adding file changes\n"))

336

repo.ui.status(_("adding file changes\n"))

337

newrevs, newfiles = _addchangegroupfiles(

337

newrevs, newfiles = _addchangegroupfiles(

338

repo, self, revmap, trp, efiles, needfiles)

338

repo, self, revmap, trp, efiles, needfiles)

339

revisions += newrevs

339

revisions += newrevs

340

files += newfiles

340

files += newfiles

341

342

deltaheads = 0

342

deltaheads = 0

343

if oldheads:

343

if oldheads:

344

heads = cl.heads()

344

heads = cl.heads()

345

deltaheads = len(heads) - len(oldheads)

345

deltaheads = len(heads) - len(oldheads)

346

for h in heads:

346

for h in heads:

347

if h not in oldheads and repo[h].closesbranch():

347

if h not in oldheads and repo[h].closesbranch():

348

deltaheads -= 1

348

deltaheads -= 1

349

htext = ""

349

htext = ""

350

if deltaheads:

350

if deltaheads:

351

htext = _(" (%+d heads)") % deltaheads

351

htext = _(" (%+d heads)") % deltaheads

352

353

repo.ui.status(_("added %d changesets"

353

repo.ui.status(_("added %d changesets"

354

" with %d changes to %d files%s\n")

354

" with %d changes to %d files%s\n")

355

% (changesets, revisions, files, htext))

355

% (changesets, revisions, files, htext))

356

repo.invalidatevolatilesets()

356

repo.invalidatevolatilesets()

357

358

if changesets > 0:

358

if changesets > 0:

359

if 'node' not in tr.hookargs:

359

if 'node' not in tr.hookargs:

360

tr.hookargs['node'] = hex(cl.node(clstart))

360

tr.hookargs['node'] = hex(cl.node(clstart))

361

tr.hookargs['node_last'] = hex(cl.node(clend - 1))

361

tr.hookargs['node_last'] = hex(cl.node(clend - 1))

362

hookargs = dict(tr.hookargs)

362

hookargs = dict(tr.hookargs)

363

else:

363

else:

364

hookargs = dict(tr.hookargs)

364

hookargs = dict(tr.hookargs)

365

hookargs['node'] = hex(cl.node(clstart))

365

hookargs['node'] = hex(cl.node(clstart))

366

hookargs['node_last'] = hex(cl.node(clend - 1))

366

hookargs['node_last'] = hex(cl.node(clend - 1))

367

repo.hook('pretxnchangegroup',

367

repo.hook('pretxnchangegroup',

368

throw=True, **pycompat.strkwargs(hookargs))

368

throw=True, **pycompat.strkwargs(hookargs))

369

370

added = [cl.node(r) for r in xrange(clstart, clend)]

370

added = [cl.node(r) for r in xrange(clstart, clend)]

371

phaseall = None

371

phaseall = None

372

if srctype in ('push', 'serve'):

372

if srctype in ('push', 'serve'):

373

# Old servers can not push the boundary themselves.

373

# Old servers can not push the boundary themselves.

374

# New servers won't push the boundary if changeset already

374

# New servers won't push the boundary if changeset already

375

# exists locally as secret

375

# exists locally as secret

376

#

376

#

377

# We should not use added here but the list of all change in

377

# We should not use added here but the list of all change in

378

# the bundle

378

# the bundle

379

if repo.publishing():

379

if repo.publishing():

380

targetphase = phaseall = phases.public

380

targetphase = phaseall = phases.public

381

else:

381

else:

382

# closer target phase computation

382

# closer target phase computation

383

384

# Those changesets have been pushed from the

384

# Those changesets have been pushed from the

385

# outside, their phases are going to be pushed

385

# outside, their phases are going to be pushed

386

# alongside. Therefor `targetphase` is

386

# alongside. Therefor `targetphase` is

387

# ignored.

387

# ignored.

388

targetphase = phaseall = phases.draft

388

targetphase = phaseall = phases.draft

389

if added:

389

if added:

390

phases.registernew(repo, tr, targetphase, added)

390

phases.registernew(repo, tr, targetphase, added)

391

if phaseall is not None:

391

if phaseall is not None:

392

phases.advanceboundary(repo, tr, phaseall, cgnodes)

392

phases.advanceboundary(repo, tr, phaseall, cgnodes)

393

394

if changesets > 0:

394

if changesets > 0:

395

396

def runhooks():

396

def runhooks():

397

# These hooks run when the lock releases, not when the

397

# These hooks run when the lock releases, not when the

398

# transaction closes. So it's possible for the changelog

398

# transaction closes. So it's possible for the changelog

399

# to have changed since we last saw it.

399

# to have changed since we last saw it.

400

if clstart >= len(repo):

400

if clstart >= len(repo):

401

return

401

return

402

403

repo.hook("changegroup", **pycompat.strkwargs(hookargs))

403

repo.hook("changegroup", **pycompat.strkwargs(hookargs))

404

405

for n in added:

405

for n in added:

406

args = hookargs.copy()

406

args = hookargs.copy()

407

args['node'] = hex(n)

407

args['node'] = hex(n)

408

del args['node_last']

408

del args['node_last']

409

repo.hook("incoming", **pycompat.strkwargs(args))

409

repo.hook("incoming", **pycompat.strkwargs(args))

410

411

newheads = [h for h in repo.heads()

411

newheads = [h for h in repo.heads()

412

if h not in oldheads]

412

if h not in oldheads]

413

repo.ui.log("incoming",

413

repo.ui.log("incoming",

414

"%d incoming changes - new heads: %s\n",

414

"%d incoming changes - new heads: %s\n",

415

len(added),

415

len(added),

416

', '.join([hex(c[:6]) for c in newheads]))

416

', '.join([hex(c[:6]) for c in newheads]))

417

418

tr.addpostclose('changegroup-runhooks-%020i' % clstart,

418

tr.addpostclose('changegroup-runhooks-%020i' % clstart,

419

lambda tr: repo._afterlock(runhooks))

419

lambda tr: repo._afterlock(runhooks))

420

finally:

420

finally:

421

repo.ui.flush()

421

repo.ui.flush()

422

# never return 0 here:

422

# never return 0 here:

423

if deltaheads < 0:

423

if deltaheads < 0:

424

ret = deltaheads - 1

424

ret = deltaheads - 1

425

else:

425

else:

426

ret = deltaheads + 1

426

ret = deltaheads + 1

427

return ret

427

return ret

428

429

def deltaiter(self):

429

def deltaiter(self):

430

"""

430

"""

431

returns an iterator of the deltas in this changegroup

431

returns an iterator of the deltas in this changegroup

432

433

Useful for passing to the underlying storage system to be stored.

433

Useful for passing to the underlying storage system to be stored.

434

"""

434

"""

435

chain = None

435

chain = None

436

for chunkdata in iter(lambda: self.deltachunk(chain), {}):

436

for chunkdata in iter(lambda: self.deltachunk(chain), {}):

437

# Chunkdata: (node, p1, p2, cs, deltabase, delta, flags)

437

# Chunkdata: (node, p1, p2, cs, deltabase, delta, flags)

438

yield chunkdata

438

yield chunkdata

439

chain = chunkdata[0]

439

chain = chunkdata[0]

440

441

class cg2unpacker(cg1unpacker):

441

class cg2unpacker(cg1unpacker):

442

"""Unpacker for cg2 streams.

442

"""Unpacker for cg2 streams.

443

444

cg2 streams add support for generaldelta, so the delta header

444

cg2 streams add support for generaldelta, so the delta header

445

format is slightly different. All other features about the data

445

format is slightly different. All other features about the data

446

remain the same.

446

remain the same.

447

"""

447

"""

448

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

448

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

449

deltaheadersize = struct.calcsize(deltaheader)

449

deltaheadersize = struct.calcsize(deltaheader)

450

version = '02'

450

version = '02'

451

452

def _deltaheader(self, headertuple, prevnode):

452

def _deltaheader(self, headertuple, prevnode):

453

node, p1, p2, deltabase, cs = headertuple

453

node, p1, p2, deltabase, cs = headertuple

454

flags = 0

454

flags = 0

455

return node, p1, p2, deltabase, cs, flags

455

return node, p1, p2, deltabase, cs, flags

456

457

class cg3unpacker(cg2unpacker):

457

class cg3unpacker(cg2unpacker):

458

"""Unpacker for cg3 streams.

458

"""Unpacker for cg3 streams.

459

460

cg3 streams add support for exchanging treemanifests and revlog

460

cg3 streams add support for exchanging treemanifests and revlog

461

flags. It adds the revlog flags to the delta header and an empty chunk

461

flags. It adds the revlog flags to the delta header and an empty chunk

462

separating manifests and files.

462

separating manifests and files.

463

"""

463

"""

464

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

464

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

465

deltaheadersize = struct.calcsize(deltaheader)

465

deltaheadersize = struct.calcsize(deltaheader)

466

version = '03'

466

version = '03'

467

_grouplistcount = 2 # One list of manifests and one list of files

467

_grouplistcount = 2 # One list of manifests and one list of files

468

469

def _deltaheader(self, headertuple, prevnode):

469

def _deltaheader(self, headertuple, prevnode):

470

node, p1, p2, deltabase, cs, flags = headertuple

470

node, p1, p2, deltabase, cs, flags = headertuple

471

return node, p1, p2, deltabase, cs, flags

471

return node, p1, p2, deltabase, cs, flags

472

473

def _unpackmanifests(self, repo, revmap, trp, prog):

473

def _unpackmanifests(self, repo, revmap, trp, prog):

474

super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog)

474

super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog)

475

for chunkdata in iter(self.filelogheader, {}):

475

for chunkdata in iter(self.filelogheader, {}):

476

# If we get here, there are directory manifests in the changegroup

476

# If we get here, there are directory manifests in the changegroup

477

d = chunkdata["filename"]

477

d = chunkdata["filename"]

478

repo.ui.debug("adding %s revisions\n" % d)

478

repo.ui.debug("adding %s revisions\n" % d)

479

dirlog = repo.manifestlog._revlog.dirlog(d)

479

dirlog = repo.manifestlog._revlog.dirlog(d)

480

deltas = self.deltaiter()

480

deltas = self.deltaiter()

481

if not dirlog.addgroup(deltas, revmap, trp):

481

if not dirlog.addgroup(deltas, revmap, trp):

482

raise error.Abort(_("received dir revlog group is empty"))

482

raise error.Abort(_("received dir revlog group is empty"))

483

484

class headerlessfixup(object):

484

class headerlessfixup(object):

485

def __init__(self, fh, h):

485

def __init__(self, fh, h):

486

self._h = h

486

self._h = h

487

self._fh = fh

487

self._fh = fh

488

def read(self, n):

488

def read(self, n):

489

if self._h:

489

if self._h:

490

d, self._h = self._h[:n], self._h[n:]

490

d, self._h = self._h[:n], self._h[n:]

491

if len(d) < n:

491

if len(d) < n:

492

d += readexactly(self._fh, n - len(d))

492

d += readexactly(self._fh, n - len(d))

493

return d

493

return d

494

return readexactly(self._fh, n)

494

return readexactly(self._fh, n)

495

496

class cg1packer(object):

496

class cg1packer(object):

497

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

497

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

498

version = '01'

498

version = '01'

499

def __init__(self, repo, bundlecaps=None):

499

def __init__(self, repo, bundlecaps=None):

500

"""Given a source repo, construct a bundler.

500

"""Given a source repo, construct a bundler.

501

502

bundlecaps is optional and can be used to specify the set of

502

bundlecaps is optional and can be used to specify the set of

503

capabilities which can be used to build the bundle. While bundlecaps is

503

capabilities which can be used to build the bundle. While bundlecaps is

504

unused in core Mercurial, extensions rely on this feature to communicate

504

unused in core Mercurial, extensions rely on this feature to communicate

505

capabilities to customize the changegroup packer.

505

capabilities to customize the changegroup packer.

506

"""

506

"""

507

# Set of capabilities we can use to build the bundle.

507

# Set of capabilities we can use to build the bundle.

508

if bundlecaps is None:

508

if bundlecaps is None:

509

bundlecaps = set()

509

bundlecaps = set()

510

self._bundlecaps = bundlecaps

510

self._bundlecaps = bundlecaps

511

# experimental config: bundle.reorder

511

# experimental config: bundle.reorder

512

reorder = repo.ui.config('bundle', 'reorder')

512

reorder = repo.ui.config('bundle', 'reorder')

513

if reorder == 'auto':

513

if reorder == 'auto':

514

reorder = None

514

reorder = None

515

else:

515

else:

516

reorder = stringutil.parsebool(reorder)

516

reorder = stringutil.parsebool(reorder)

517

self._repo = repo

517

self._repo = repo

518

self._reorder = reorder

518

self._reorder = reorder

519

self._progress = repo.ui.progress

519

self._progress = repo.ui.progress

520

if self._repo.ui.verbose and not self._repo.ui.debugflag:

520

if self._repo.ui.verbose and not self._repo.ui.debugflag:

521

self._verbosenote = self._repo.ui.note

521

self._verbosenote = self._repo.ui.note

522

else:

522

else:

523

self._verbosenote = lambda s: None

523

self._verbosenote = lambda s: None

524

525

def close(self):

525

def close(self):

526

return closechunk()

526

return closechunk()

527

528

def fileheader(self, fname):

528

def fileheader(self, fname):

529

return chunkheader(len(fname)) + fname

529

return chunkheader(len(fname)) + fname

530

531

# Extracted both for clarity and for overriding in extensions.

531

# Extracted both for clarity and for overriding in extensions.

532

def _sortgroup(self, revlog, nodelist, lookup):

532

def _sortgroup(self, revlog, nodelist, lookup):

533

"""Sort nodes for change group and turn them into revnums."""

533

"""Sort nodes for change group and turn them into revnums."""

534

# for generaldelta revlogs, we linearize the revs; this will both be

534

# for generaldelta revlogs, we linearize the revs; this will both be

535

# much quicker and generate a much smaller bundle

535

# much quicker and generate a much smaller bundle

536

if (revlog._generaldelta and self._reorder is None) or self._reorder:

536

if (revlog._generaldelta and self._reorder is None) or self._reorder:

537

dag = dagutil.revlogdag(revlog)

537

dag = dagutil.revlogdag(revlog)

538

return dag.linearize(set(revlog.rev(n) for n in nodelist))

538

return dag.linearize(set(revlog.rev(n) for n in nodelist))

539

else:

539

else:

540

return sorted([revlog.rev(n) for n in nodelist])

540

return sorted([revlog.rev(n) for n in nodelist])

541

542

def group(self, nodelist, revlog, lookup, units=None):

542

def group(self, nodelist, revlog, lookup, units=None):

543

"""Calculate a delta group, yielding a sequence of changegroup chunks

543

"""Calculate a delta group, yielding a sequence of changegroup chunks

544

(strings).

544

(strings).

545

546

Given a list of changeset revs, return a set of deltas and

546

Given a list of changeset revs, return a set of deltas and

547

metadata corresponding to nodes. The first delta is

547

metadata corresponding to nodes. The first delta is

548

first parent(nodelist[0]) -> nodelist[0], the receiver is

548

first parent(nodelist[0]) -> nodelist[0], the receiver is

549

guaranteed to have this parent as it has all history before

549

guaranteed to have this parent as it has all history before

550

these changesets. In the case firstparent is nullrev the

550

these changesets. In the case firstparent is nullrev the

551

changegroup starts with a full revision.

551

changegroup starts with a full revision.

552

553

If units is not None, progress detail will be generated, units specifies

553

If units is not None, progress detail will be generated, units specifies

554

the type of revlog that is touched (changelog, manifest, etc.).

554

the type of revlog that is touched (changelog, manifest, etc.).

555

"""

555

"""

556

# if we don't have any revisions touched by these changesets, bail

556

# if we don't have any revisions touched by these changesets, bail

557

if len(nodelist) == 0:

557

if len(nodelist) == 0:

558

yield self.close()

558

yield self.close()

559

return

559

return

560

561

revs = self._sortgroup(revlog, nodelist, lookup)

561

revs = self._sortgroup(revlog, nodelist, lookup)

562

563

# add the parent of the first rev

563

# add the parent of the first rev

564

p = revlog.parentrevs(revs[0])[0]

564

p = revlog.parentrevs(revs[0])[0]

565

revs.insert(0, p)

565

revs.insert(0, p)

566

567

# build deltas

567

# build deltas

568

total = len(revs) - 1

568

total = len(revs) - 1

569

msgbundling = _('bundling')

569

msgbundling = _('bundling')

570

for r in xrange(len(revs) - 1):

570

for r in xrange(len(revs) - 1):

571

if units is not None:

571

if units is not None:

572

self._progress(msgbundling, r + 1, unit=units, total=total)

572

self._progress(msgbundling, r + 1, unit=units, total=total)

573

prev, curr = revs[r], revs[r + 1]

573

prev, curr = revs[r], revs[r + 1]

574

linknode = lookup(revlog.node(curr))

574

linknode = lookup(revlog.node(curr))

575

for c in self.revchunk(revlog, curr, prev, linknode):

575

for c in self.revchunk(revlog, curr, prev, linknode):

576

yield c

576

yield c

577

578

if units is not None:

578

if units is not None:

579

self._progress(msgbundling, None)

579

self._progress(msgbundling, None)

580

yield self.close()

580

yield self.close()

581

582

# filter any nodes that claim to be part of the known set

582

# filter any nodes that claim to be part of the known set

583

def prune(self, revlog, missing, commonrevs):

583

def prune(self, revlog, missing, commonrevs):

584

rr, rl = revlog.rev, revlog.linkrev

584

rr, rl = revlog.rev, revlog.linkrev

585

return [n for n in missing if rl(rr(n)) not in commonrevs]

585

return [n for n in missing if rl(rr(n)) not in commonrevs]

586

587

def _packmanifests(self, dir, mfnodes, lookuplinknode):

587

def _packmanifests(self, dir, mfnodes, lookuplinknode):

588

"""Pack flat manifests into a changegroup stream."""

588

"""Pack flat manifests into a changegroup stream."""

589

assert not dir

589

assert not dir

590

for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,

590

for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,

591

lookuplinknode, units=_('manifests')):

591

lookuplinknode, units=_('manifests')):

592

yield chunk

592

yield chunk

593

594

def _manifestsdone(self):

594

def _manifestsdone(self):

595

return ''

595

return ''

596

597

def generate(self, commonrevs, clnodes, fastpathlinkrev, source):

597

def generate(self, commonrevs, clnodes, fastpathlinkrev, source):

598

'''yield a sequence of changegroup chunks (strings)'''

598

'''yield a sequence of changegroup chunks (strings)'''

599

repo = self._repo

599

repo = self._repo

600

cl = repo.changelog

600

cl = repo.changelog

601

602

clrevorder = {}

602

clrevorder = {}

603

mfs = {} # needed manifests

603

mfs = {} # needed manifests

604

fnodes = {} # needed file nodes

604

fnodes = {} # needed file nodes

605

changedfiles = set()

605

changedfiles = set()

606

607

# Callback for the changelog, used to collect changed files and manifest

607

# Callback for the changelog, used to collect changed files and manifest

608

# nodes.

608

# nodes.

609

# Returns the linkrev node (identity in the changelog case).

609

# Returns the linkrev node (identity in the changelog case).

610

def lookupcl(x):

610

def lookupcl(x):

611

c = cl.read(x)

611

c = cl.read(x)

612

clrevorder[x] = len(clrevorder)

612

clrevorder[x] = len(clrevorder)

613

n = c[0]

613

n = c[0]

614

# record the first changeset introducing this manifest version

614

# record the first changeset introducing this manifest version

615

mfs.setdefault(n, x)

615

mfs.setdefault(n, x)

616

# Record a complete list of potentially-changed files in

616

# Record a complete list of potentially-changed files in

617

# this manifest.

617

# this manifest.

618

changedfiles.update(c[3])

618

changedfiles.update(c[3])

619

return x

619

return x

620

621

self._verbosenote(_('uncompressed size of bundle content:\n'))

621

self._verbosenote(_('uncompressed size of bundle content:\n'))

622

size = 0

622

size = 0

623

for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):

623

for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):

624

size += len(chunk)

624

size += len(chunk)

625

yield chunk

625

yield chunk

626

self._verbosenote(_('%8.i (changelog)\n') % size)

626

self._verbosenote(_('%8.i (changelog)\n') % size)

627

628

# We need to make sure that the linkrev in the changegroup refers to

628

# We need to make sure that the linkrev in the changegroup refers to

629

# the first changeset that introduced the manifest or file revision.

629

# the first changeset that introduced the manifest or file revision.

630

# The fastpath is usually safer than the slowpath, because the filelogs

630

# The fastpath is usually safer than the slowpath, because the filelogs

631

# are walked in revlog order.

631

# are walked in revlog order.

632

#

632

#

633

# When taking the slowpath with reorder=None and the manifest revlog

633

# When taking the slowpath with reorder=None and the manifest revlog

634

# uses generaldelta, the manifest may be walked in the "wrong" order.

634

# uses generaldelta, the manifest may be walked in the "wrong" order.

635

# Without 'clrevorder', we would get an incorrect linkrev (see fix in

635

# Without 'clrevorder', we would get an incorrect linkrev (see fix in

636

# cc0ff93d0c0c).

636

# cc0ff93d0c0c).

637

#

637

#

638

# When taking the fastpath, we are only vulnerable to reordering

638

# When taking the fastpath, we are only vulnerable to reordering

639

# of the changelog itself. The changelog never uses generaldelta, so

639

# of the changelog itself. The changelog never uses generaldelta, so

640

# it is only reordered when reorder=True. To handle this case, we

640

# it is only reordered when reorder=True. To handle this case, we

641

# simply take the slowpath, which already has the 'clrevorder' logic.

641

# simply take the slowpath, which already has the 'clrevorder' logic.

642

# This was also fixed in cc0ff93d0c0c.

642

# This was also fixed in cc0ff93d0c0c.

643

fastpathlinkrev = fastpathlinkrev and not self._reorder

643

fastpathlinkrev = fastpathlinkrev and not self._reorder

644

# Treemanifests don't work correctly with fastpathlinkrev

644

# Treemanifests don't work correctly with fastpathlinkrev

645

# either, because we don't discover which directory nodes to

645

# either, because we don't discover which directory nodes to

646

# send along with files. This could probably be fixed.

646

# send along with files. This could probably be fixed.

647

fastpathlinkrev = fastpathlinkrev and (

647

fastpathlinkrev = fastpathlinkrev and (

648

'treemanifest' not in repo.requirements)

648

'treemanifest' not in repo.requirements)

649

650

for chunk in self.generatemanifests(commonrevs, clrevorder,

650

for chunk in self.generatemanifests(commonrevs, clrevorder,

651

fastpathlinkrev, mfs, fnodes, source):

651

fastpathlinkrev, mfs, fnodes, source):

652

yield chunk

652

yield chunk

653

mfs.clear()

653

mfs.clear()

654

clrevs = set(cl.rev(x) for x in clnodes)

654

clrevs = set(cl.rev(x) for x in clnodes)

655

656

if not fastpathlinkrev:

656

if not fastpathlinkrev:

657

def linknodes(unused, fname):

657

def linknodes(unused, fname):

658

return fnodes.get(fname, {})

658

return fnodes.get(fname, {})

659

else:

659

else:

660

cln = cl.node

660

cln = cl.node

661

def linknodes(filerevlog, fname):

661

def linknodes(filerevlog, fname):

662

llr = filerevlog.linkrev

662

llr = filerevlog.linkrev

663

fln = filerevlog.node

663

fln = filerevlog.node

664

revs = ((r, llr(r)) for r in filerevlog)

664

revs = ((r, llr(r)) for r in filerevlog)

665

return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)

665

return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)

666

667

for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,

667

for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,

668

source):

668

source):

669

yield chunk

669

yield chunk

670

671

yield self.close()

671

yield self.close()

672

673

if clnodes:

673

if clnodes:

674

repo.hook('outgoing', node=hex(clnodes[0]), source=source)

674

repo.hook('outgoing', node=hex(clnodes[0]), source=source)

675

676

def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,

676

def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,

677

fnodes, source):

677

fnodes, source):

678

"""Returns an iterator of changegroup chunks containing manifests.

678

"""Returns an iterator of changegroup chunks containing manifests.

679

680

`source` is unused here, but is used by extensions like remotefilelog to

680

`source` is unused here, but is used by extensions like remotefilelog to

681

change what is sent based in pulls vs pushes, etc.

681

change what is sent based in pulls vs pushes, etc.

682

"""

682

"""

683

repo = self._repo

683

repo = self._repo

684

mfl = repo.manifestlog

684

mfl = repo.manifestlog

685

dirlog = mfl._revlog.dirlog

685

dirlog = mfl._revlog.dirlog

686

tmfnodes = {'': mfs}

686

tmfnodes = {'': mfs}

687

688

# Callback for the manifest, used to collect linkrevs for filelog

688

# Callback for the manifest, used to collect linkrevs for filelog

689

# revisions.

689

# revisions.

690

# Returns the linkrev node (collected in lookupcl).

690

# Returns the linkrev node (collected in lookupcl).

691

def makelookupmflinknode(dir, nodes):

691

def makelookupmflinknode(dir, nodes):

692

if fastpathlinkrev:

692

if fastpathlinkrev:

693

assert not dir

693

assert not dir

694

return mfs.__getitem__

694

return mfs.__getitem__

695

696

def lookupmflinknode(x):

696

def lookupmflinknode(x):

697

"""Callback for looking up the linknode for manifests.

697

"""Callback for looking up the linknode for manifests.

698

699

Returns the linkrev node for the specified manifest.

699

Returns the linkrev node for the specified manifest.

700

701

SIDE EFFECT:

701

SIDE EFFECT:

702

703

1) fclnodes gets populated with the list of relevant

703

1) fclnodes gets populated with the list of relevant

704

file nodes if we're not using fastpathlinkrev

704

file nodes if we're not using fastpathlinkrev

705

2) When treemanifests are in use, collects treemanifest nodes

705

2) When treemanifests are in use, collects treemanifest nodes

706

to send

706

to send

707

708

Note that this means manifests must be completely sent to

708

Note that this means manifests must be completely sent to

709

the client before you can trust the list of files and

709

the client before you can trust the list of files and

710

treemanifests to send.

710

treemanifests to send.

711

"""

711

"""

712

clnode = nodes[x]

712

clnode = nodes[x]

713

mdata = mfl.get(dir, x).readfast(shallow=True)

713

mdata = mfl.get(dir, x).readfast(shallow=True)

714

for p, n, fl in mdata.iterentries():

714

for p, n, fl in mdata.iterentries():

715

if fl == 't': # subdirectory manifest

715

if fl == 't': # subdirectory manifest

716

subdir = dir + p + '/'

716

subdir = dir + p + '/'

717

tmfclnodes = tmfnodes.setdefault(subdir, {})

717

tmfclnodes = tmfnodes.setdefault(subdir, {})

718

tmfclnode = tmfclnodes.setdefault(n, clnode)

718

tmfclnode = tmfclnodes.setdefault(n, clnode)

719

if clrevorder[clnode] < clrevorder[tmfclnode]:

719

if clrevorder[clnode] < clrevorder[tmfclnode]:

720

tmfclnodes[n] = clnode

720

tmfclnodes[n] = clnode

721

else:

721

else:

722

f = dir + p

722

f = dir + p

723

fclnodes = fnodes.setdefault(f, {})

723

fclnodes = fnodes.setdefault(f, {})

724

fclnode = fclnodes.setdefault(n, clnode)

724

fclnode = fclnodes.setdefault(n, clnode)

725

if clrevorder[clnode] < clrevorder[fclnode]:

725

if clrevorder[clnode] < clrevorder[fclnode]:

726

fclnodes[n] = clnode

726

fclnodes[n] = clnode

727

return clnode

727

return clnode

728

return lookupmflinknode

728

return lookupmflinknode

729

730

size = 0

730

size = 0

731

while tmfnodes:

731

while tmfnodes:

732

dir, nodes = tmfnodes.popitem()

732

dir, nodes = tmfnodes.popitem()

733

prunednodes = self.prune(dirlog(dir), nodes, commonrevs)

733

prunednodes = self.prune(dirlog(dir), nodes, commonrevs)

734

if not dir or prunednodes:

734

if not dir or prunednodes:

735

for x in self._packmanifests(dir, prunednodes,

735

for x in self._packmanifests(dir, prunednodes,

736

makelookupmflinknode(dir, nodes)):

736

makelookupmflinknode(dir, nodes)):

737

size += len(x)

737

size += len(x)

738

yield x

738

yield x

739

self._verbosenote(_('%8.i (manifests)\n') % size)

739

self._verbosenote(_('%8.i (manifests)\n') % size)

740

yield self._manifestsdone()

740

yield self._manifestsdone()

741

742

# The 'source' parameter is useful for extensions

742

# The 'source' parameter is useful for extensions

743

def generatefiles(self, changedfiles, linknodes, commonrevs, source):

743

def generatefiles(self, changedfiles, linknodes, commonrevs, source):

744

repo = self._repo

744

repo = self._repo

745

progress = self._progress

745

progress = self._progress

746

msgbundling = _('bundling')

746

msgbundling = _('bundling')

747

748

total = len(changedfiles)

748

total = len(changedfiles)

749

# for progress output

749

# for progress output

750

msgfiles = _('files')

750

msgfiles = _('files')

751

for i, fname in enumerate(sorted(changedfiles)):

751

for i, fname in enumerate(sorted(changedfiles)):

752

filerevlog = repo.file(fname)

752

filerevlog = repo.file(fname)

753

if not filerevlog:

753

if not filerevlog:

754

raise error.Abort(_("empty or missing file data for %s") %

754

raise error.Abort(_("empty or missing file data for %s") %

755

fname)

755

fname)

756

757

linkrevnodes = linknodes(filerevlog, fname)

757

linkrevnodes = linknodes(filerevlog, fname)

758

# Lookup for filenodes, we collected the linkrev nodes above in the

758

# Lookup for filenodes, we collected the linkrev nodes above in the

759

# fastpath case and with lookupmf in the slowpath case.

759

# fastpath case and with lookupmf in the slowpath case.

760

def lookupfilelog(x):

760

def lookupfilelog(x):

761

return linkrevnodes[x]

761

return linkrevnodes[x]

762

763

filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)

763

filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)

764

if filenodes:

764

if filenodes:

765

progress(msgbundling, i + 1, item=fname, unit=msgfiles,

765

progress(msgbundling, i + 1, item=fname, unit=msgfiles,

766

total=total)

766

total=total)

767

h = self.fileheader(fname)

767

h = self.fileheader(fname)

768

size = len(h)

768

size = len(h)

769

yield h

769

yield h

770

for chunk in self.group(filenodes, filerevlog, lookupfilelog):

770

for chunk in self.group(filenodes, filerevlog, lookupfilelog):

771

size += len(chunk)

771

size += len(chunk)

772

yield chunk

772

yield chunk

773

self._verbosenote(_('%8.i %s\n') % (size, fname))

773

self._verbosenote(_('%8.i %s\n') % (size, fname))

774

progress(msgbundling, None)

774

progress(msgbundling, None)

775

776

def deltaparent(self, revlog, rev, p1, p2, prev):

776

def deltaparent(self, revlog, rev, p1, p2, prev):

777

if not revlog.candelta(prev, rev):

777

if not revlog.candelta(prev, rev):

778

raise error.ProgrammingError('cg1 should not be used in this case')

778

raise error.ProgrammingError('cg1 should not be used in this case')

779

return prev

779

return prev

780

781

def revchunk(self, revlog, rev, prev, linknode):

781

def revchunk(self, revlog, rev, prev, linknode):

782

node = revlog.node(rev)

782

node = revlog.node(rev)

783

p1, p2 = revlog.parentrevs(rev)

783

p1, p2 = revlog.parentrevs(rev)

784

base = self.deltaparent(revlog, rev, p1, p2, prev)

784

base = self.deltaparent(revlog, rev, p1, p2, prev)

785

786

prefix = ''

786

prefix = ''

787

if revlog.iscensored(base) or revlog.iscensored(rev):

787

if revlog.iscensored(base) or revlog.iscensored(rev):

788

try:

788

try:

789

delta = revlog.revision(node, raw=True)

789

delta = revlog.revision(node, raw=True)

790

except error.CensoredNodeError as e:

790

except error.CensoredNodeError as e:

791

delta = e.tombstone

791

delta = e.tombstone

792

if base == nullrev:

792

if base == nullrev:

793

prefix = mdiff.trivialdiffheader(len(delta))

793

prefix = mdiff.trivialdiffheader(len(delta))

794

else:

794

else:

795

baselen = revlog.rawsize(base)

795

baselen = revlog.rawsize(base)

796

prefix = mdiff.replacediffheader(baselen, len(delta))

796

prefix = mdiff.replacediffheader(baselen, len(delta))

797

elif base == nullrev:

797

elif base == nullrev:

798

delta = revlog.revision(node, raw=True)

798

delta = revlog.revision(node, raw=True)

799

prefix = mdiff.trivialdiffheader(len(delta))

799

prefix = mdiff.trivialdiffheader(len(delta))

800

else:

800

else:

801

delta = revlog.revdiff(base, rev)

801

delta = revlog.revdiff(base, rev)

802

p1n, p2n = revlog.parents(node)

802

p1n, p2n = revlog.parents(node)

803

basenode = revlog.node(base)

803

basenode = revlog.node(base)

804

flags = revlog.flags(rev)

804

flags = revlog.flags(rev)

805

meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)

805

meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)

806

meta += prefix

806

meta += prefix

807

l = len(meta) + len(delta)

807

l = len(meta) + len(delta)

808

yield chunkheader(l)

808

yield chunkheader(l)

809

yield meta

809

yield meta

810

yield delta

810

yield delta

811

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

811

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

812

# do nothing with basenode, it is implicitly the previous one in HG10

812

# do nothing with basenode, it is implicitly the previous one in HG10

813

# do nothing with flags, it is implicitly 0 for cg1 and cg2

813

# do nothing with flags, it is implicitly 0 for cg1 and cg2

814

return struct.pack(self.deltaheader, node, p1n, p2n, linknode)

814

return struct.pack(self.deltaheader, node, p1n, p2n, linknode)

815

816

class cg2packer(cg1packer):

816

class cg2packer(cg1packer):

817

version = '02'

817

version = '02'

818

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

818

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

819

820

def __init__(self, repo, bundlecaps=None):

820

def __init__(self, repo, bundlecaps=None):

821

super(cg2packer, self).__init__(repo, bundlecaps)

821

super(cg2packer, self).__init__(repo, bundlecaps)

822

if self._reorder is None:

822

if self._reorder is None:

823

# Since generaldelta is directly supported by cg2, reordering

823

# Since generaldelta is directly supported by cg2, reordering

824

# generally doesn't help, so we disable it by default (treating

824

# generally doesn't help, so we disable it by default (treating

825

# bundle.reorder=auto just like bundle.reorder=False).

825

# bundle.reorder=auto just like bundle.reorder=False).

826

self._reorder = False

826

self._reorder = False

827

828

def deltaparent(self, revlog, rev, p1, p2, prev):

828

def deltaparent(self, revlog, rev, p1, p2, prev):

829

dp = revlog.deltaparent(rev)

829

dp = revlog.deltaparent(rev)

830

if dp == nullrev and revlog.storedeltachains:

830

if dp == nullrev and revlog.storedeltachains:

831

# Avoid sending full revisions when delta parent is null. Pick prev

831

# Avoid sending full revisions when delta parent is null. Pick prev

832

# in that case. It's tempting to pick p1 in this case, as p1 will

832

# in that case. It's tempting to pick p1 in this case, as p1 will

833

# be smaller in the common case. However, computing a delta against

833

# be smaller in the common case. However, computing a delta against

834

# p1 may require resolving the raw text of p1, which could be

834

# p1 may require resolving the raw text of p1, which could be

835

# expensive. The revlog caches should have prev cached, meaning

835

# expensive. The revlog caches should have prev cached, meaning

836

# less CPU for changegroup generation. There is likely room to add

836

# less CPU for changegroup generation. There is likely room to add

837

# a flag and/or config option to control this behavior.

837

# a flag and/or config option to control this behavior.

838

base = prev

838

base = prev

839

elif dp == nullrev:

839

elif dp == nullrev:

840

# revlog is configured to use full snapshot for a reason,

840

# revlog is configured to use full snapshot for a reason,

841

# stick to full snapshot.

841

# stick to full snapshot.

842

base = nullrev

842

base = nullrev

843

elif dp not in (p1, p2, prev):

843

elif dp not in (p1, p2, prev):

844

# Pick prev when we can't be sure remote has the base revision.

844

# Pick prev when we can't be sure remote has the base revision.

845

return prev

845

return prev

846

else:

846

else:

847

base = dp

847

base = dp

848

if base != nullrev and not revlog.candelta(base, rev):

848

if base != nullrev and not revlog.candelta(base, rev):

849

base = nullrev

849

base = nullrev

850

return base

850

return base

851

852

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

852

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

853

# Do nothing with flags, it is implicitly 0 in cg1 and cg2

853

# Do nothing with flags, it is implicitly 0 in cg1 and cg2

854

return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)

854

return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)

855

856

class cg3packer(cg2packer):

856

class cg3packer(cg2packer):

857

version = '03'

857

version = '03'

858

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

858

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

859

860

def _packmanifests(self, dir, mfnodes, lookuplinknode):

860

def _packmanifests(self, dir, mfnodes, lookuplinknode):

861

if dir:

861

if dir:

862

yield self.fileheader(dir)

862

yield self.fileheader(dir)

863

864

dirlog = self._repo.manifestlog._revlog.dirlog(dir)

864

dirlog = self._repo.manifestlog._revlog.dirlog(dir)

865

for chunk in self.group(mfnodes, dirlog, lookuplinknode,

865

for chunk in self.group(mfnodes, dirlog, lookuplinknode,

866

units=_('manifests')):

866

units=_('manifests')):

867

yield chunk

867

yield chunk

868

869

def _manifestsdone(self):

869

def _manifestsdone(self):

870

return self.close()

870

return self.close()

871

872

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

872

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

873

return struct.pack(

873

return struct.pack(

874

self.deltaheader, node, p1n, p2n, basenode, linknode, flags)

874

self.deltaheader, node, p1n, p2n, basenode, linknode, flags)

875

876

_packermap = {'01': (cg1packer, cg1unpacker),

876

_packermap = {'01': (cg1packer, cg1unpacker),

877

# cg2 adds support for exchanging generaldelta

877

# cg2 adds support for exchanging generaldelta

878

'02': (cg2packer, cg2unpacker),

878

'02': (cg2packer, cg2unpacker),

879

# cg3 adds support for exchanging revlog flags and treemanifests

879

# cg3 adds support for exchanging revlog flags and treemanifests

880

'03': (cg3packer, cg3unpacker),

880

'03': (cg3packer, cg3unpacker),

881

}

881

}

882

883

def allsupportedversions(repo):

883

def allsupportedversions(repo):

884

versions = set(_packermap.keys())

884

versions = set(_packermap.keys())

885

if not (repo.ui.configbool('experimental', 'changegroup3') or

885

if not (repo.ui.configbool('experimental', 'changegroup3') or

886

repo.ui.configbool('experimental', 'treemanifest') or

886

repo.ui.configbool('experimental', 'treemanifest') or

887

'treemanifest' in repo.requirements):

887

'treemanifest' in repo.requirements):

888

versions.discard('03')

888

versions.discard('03')

889

return versions

889

return versions

890

891

# Changegroup versions that can be applied to the repo

891

# Changegroup versions that can be applied to the repo

892

def supportedincomingversions(repo):

892

def supportedincomingversions(repo):

893

return allsupportedversions(repo)

893

return allsupportedversions(repo)

894

895

# Changegroup versions that can be created from the repo

895

# Changegroup versions that can be created from the repo

896

def supportedoutgoingversions(repo):

896

def supportedoutgoingversions(repo):

897

versions = allsupportedversions(repo)

897

versions = allsupportedversions(repo)

898

if 'treemanifest' in repo.requirements:

898

if 'treemanifest' in repo.requirements:

899

# Versions 01 and 02 support only flat manifests and it's just too

899

# Versions 01 and 02 support only flat manifests and it's just too

900

# expensive to convert between the flat manifest and tree manifest on

900

# expensive to convert between the flat manifest and tree manifest on

901

# the fly. Since tree manifests are hashed differently, all of history

901

# the fly. Since tree manifests are hashed differently, all of history

902

# would have to be converted. Instead, we simply don't even pretend to

902

# would have to be converted. Instead, we simply don't even pretend to

903

# support versions 01 and 02.

903

# support versions 01 and 02.

904

versions.discard('01')

904

versions.discard('01')

905

versions.discard('02')

905

versions.discard('02')

906

if NARROW_REQUIREMENT in repo.requirements:

906

if NARROW_REQUIREMENT in repo.requirements:

907

# Versions 01 and 02 don't support revlog flags, and we need to

907

# Versions 01 and 02 don't support revlog flags, and we need to

908

# support that for stripping and unbundling to work.

908

# support that for stripping and unbundling to work.

909

versions.discard('01')

909

versions.discard('01')

910

versions.discard('02')

910

versions.discard('02')

911

if LFS_REQUIREMENT in repo.requirements:

911

if LFS_REQUIREMENT in repo.requirements:

912

# Versions 01 and 02 don't support revlog flags, and we need to

912

# Versions 01 and 02 don't support revlog flags, and we need to

913

# mark LFS entries with REVIDX_EXTSTORED.

913

# mark LFS entries with REVIDX_EXTSTORED.

914

versions.discard('01')

914

versions.discard('01')

915

versions.discard('02')

915

versions.discard('02')

916

917

return versions

917

return versions

918

919

def localversion(repo):

919

def localversion(repo):

920

# Finds the best version to use for bundles that are meant to be used

920

# Finds the best version to use for bundles that are meant to be used

921

# locally, such as those from strip and shelve, and temporary bundles.

921

# locally, such as those from strip and shelve, and temporary bundles.

922

return max(supportedoutgoingversions(repo))

922

return max(supportedoutgoingversions(repo))

923

924

def safeversion(repo):

924

def safeversion(repo):

925

# Finds the smallest version that it's safe to assume clients of the repo

925

# Finds the smallest version that it's safe to assume clients of the repo

926

# will support. For example, all hg versions that support generaldelta also

926

# will support. For example, all hg versions that support generaldelta also

927

# support changegroup 02.

927

# support changegroup 02.

928

versions = supportedoutgoingversions(repo)

928

versions = supportedoutgoingversions(repo)

929

if 'generaldelta' in repo.requirements:

929

if 'generaldelta' in repo.requirements:

930

versions.discard('01')

930

versions.discard('01')

931

assert versions

931

assert versions

932

return min(versions)

932

return min(versions)

933

934

def getbundler(version, repo, bundlecaps=None):

934

def getbundler(version, repo, bundlecaps=None):

935

assert version in supportedoutgoingversions(repo)

935

assert version in supportedoutgoingversions(repo)

936

return _packermap[version][0](repo, bundlecaps)

936

return _packermap[version][0](repo, bundlecaps)

937

938

def getunbundler(version, fh, alg, extras=None):

938

def getunbundler(version, fh, alg, extras=None):

939

return _packermap[version][1](fh, alg, extras=extras)

939

return _packermap[version][1](fh, alg, extras=extras)

940

941

def _changegroupinfo(repo, nodes, source):

941

def _changegroupinfo(repo, nodes, source):

942

if repo.ui.verbose or source == 'bundle':

942

if repo.ui.verbose or source == 'bundle':

943

repo.ui.status(_("%d changesets found\n") % len(nodes))

943

repo.ui.status(_("%d changesets found\n") % len(nodes))

944

if repo.ui.debugflag:

944

if repo.ui.debugflag:

945

repo.ui.debug("list of changesets:\n")

945

repo.ui.debug("list of changesets:\n")

946

for node in nodes:

946

for node in nodes:

947

repo.ui.debug("%s\n" % hex(node))

947

repo.ui.debug("%s\n" % hex(node))

948

949

def makechangegroup(repo, outgoing, version, source, fastpath=False,

949

def makechangegroup(repo, outgoing, version, source, fastpath=False,

950

bundlecaps=None):

950

bundlecaps=None):

951

cgstream = makestream(repo, outgoing, version, source,

951

cgstream = makestream(repo, outgoing, version, source,

952

fastpath=fastpath, bundlecaps=bundlecaps)

952

fastpath=fastpath, bundlecaps=bundlecaps)

953

return getunbundler(version, util.chunkbuffer(cgstream), None,

953

return getunbundler(version, util.chunkbuffer(cgstream), None,

954

{'clcount': len(outgoing.missing) })

954

{'clcount': len(outgoing.missing) })

955

956

def makestream(repo, outgoing, version, source, fastpath=False,

956

def makestream(repo, outgoing, version, source, fastpath=False,

957

bundlecaps=None):

957

bundlecaps=None):

958

bundler = getbundler(version, repo, bundlecaps=bundlecaps)

958

bundler = getbundler(version, repo, bundlecaps=bundlecaps)

959

960

repo = repo.unfiltered()

960

repo = repo.unfiltered()

961

commonrevs = outgoing.common

961

commonrevs = outgoing.common

962

csets = outgoing.missing

962

csets = outgoing.missing

963

heads = outgoing.missingheads

963

heads = outgoing.missingheads

964

# We go through the fast path if we get told to, or if all (unfiltered

964

# We go through the fast path if we get told to, or if all (unfiltered

965

# heads have been requested (since we then know there all linkrevs will

965

# heads have been requested (since we then know there all linkrevs will

966

# be pulled by the client).

966

# be pulled by the client).

967

heads.sort()

967

heads.sort()

968

fastpathlinkrev = fastpath or (

968

fastpathlinkrev = fastpath or (

969

repo.filtername is None and heads == sorted(repo.heads()))

969

repo.filtername is None and heads == sorted(repo.heads()))

970

971

repo.hook('preoutgoing', throw=True, source=source)

971

repo.hook('preoutgoing', throw=True, source=source)

972

_changegroupinfo(repo, csets, source)

972

_changegroupinfo(repo, csets, source)

973

return bundler.generate(commonrevs, csets, fastpathlinkrev, source)

973

return bundler.generate(commonrevs, csets, fastpathlinkrev, source)

974

975

def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):

975

def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):

976

revisions = 0

976

revisions = 0

977

files = 0

977

files = 0

978

progress = repo.ui.makeprogress(_('files'), unit=_('files'),

979

total=expectedfiles)

978

for chunkdata in iter(source.filelogheader, {}):

980

for chunkdata in iter(source.filelogheader, {}):

979

files += 1

981

files += 1

980

f = chunkdata["filename"]

982

f = chunkdata["filename"]

981

repo.ui.debug("adding %s revisions\n" % f)

983

repo.ui.debug("adding %s revisions\n" % f)

982

repo.ui.progress(_('files'), files, unit=_('files'),

984

progress.increment()

983

total=expectedfiles)

984

fl = repo.file(f)

985

fl = repo.file(f)

985

o = len(fl)

986

o = len(fl)

986

try:

987

try:

987

deltas = source.deltaiter()

988

deltas = source.deltaiter()

988

if not fl.addgroup(deltas, revmap, trp):

989

if not fl.addgroup(deltas, revmap, trp):

989

raise error.Abort(_("received file revlog group is empty"))

990

raise error.Abort(_("received file revlog group is empty"))

990

except error.CensoredBaseError as e:

991

except error.CensoredBaseError as e:

991

raise error.Abort(_("received delta base is censored: %s") % e)

992

raise error.Abort(_("received delta base is censored: %s") % e)

992

revisions += len(fl) - o

993

revisions += len(fl) - o

993

if f in needfiles:

994

if f in needfiles:

994

needs = needfiles[f]

995

needs = needfiles[f]

995

for new in xrange(o, len(fl)):

996

for new in xrange(o, len(fl)):

996

n = fl.node(new)

997

n = fl.node(new)

997

if n in needs:

998

if n in needs:

998

needs.remove(n)

999

needs.remove(n)

999

else:

1000

else:

1000

raise error.Abort(

1001

raise error.Abort(

1001

_("received spurious file revlog entry"))

1002

_("received spurious file revlog entry"))

1002

if not needs:

1003

if not needs:

1003

del needfiles[f]

1004

del needfiles[f]

1004

repo.ui.progress(_('files'), None)

1005

progress.complete()

1005

1006

for f, needs in needfiles.iteritems():

1007

for f, needs in needfiles.iteritems():

1007

fl = repo.file(f)

1008

fl = repo.file(f)

1008

for n in needs:

1009

for n in needs:

1009

try:

1010

try:

1010

fl.rev(n)

1011

fl.rev(n)

1011

except error.LookupError:

1012

except error.LookupError:

1012

raise error.Abort(

1013

raise error.Abort(

1013

_('missing file data for %s:%s - run hg verify') %

1014

_('missing file data for %s:%s - run hg verify') %

1014

(f, hex(n)))

1015

(f, hex(n)))

1015

1016

return revisions, files

1017

return revisions, files

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # changegroup.py - Mercurial changegroup manipulation functions
             #
             #  Copyright 2006 Matt Mackall <mpm@selenic.com>
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             from __future__ import absolute_import
             import os
             import struct
             import weakref
             from .i18n import _
             from .node import (
                 hex,
                 nullrev,
                 short,
             )
             from . import (
                 dagutil,
                 error,
                 mdiff,
                 phases,
                 pycompat,
                 util,
             )
             from .utils import (
                 stringutil,
             )
             _CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"
             _CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"
             _CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"
             LFS_REQUIREMENT = 'lfs'
             # When narrowing is finalized and no longer subject to format changes,
             # we should move this to just "narrow" or similar.
             NARROW_REQUIREMENT = 'narrowhg-experimental'
             readexactly = util.readexactly
             def getchunk(stream):
                 """return the next chunk from stream as a string"""
                 d = readexactly(stream, 4)
                 l = struct.unpack(">l", d)[0]
                 if l <= 4:
                     if l:
                         raise error.Abort(_("invalid chunk length %d") % l)
                     return ""
                 return readexactly(stream, l - 4)
             def chunkheader(length):
                 """return a changegroup chunk header (string)"""
                 return struct.pack(">l", length + 4)
             def closechunk():
                 """return a changegroup chunk header (string) for a zero-length chunk"""
                 return struct.pack(">l", 0)
             def writechunks(ui, chunks, filename, vfs=None):
                 """Write chunks to a file and return its filename.
                 The stream is assumed to be a bundle file.
                 Existing files will not be overwritten.
                 If no filename is specified, a temporary file is created.
                 """
                 fh = None
                 cleanup = None
                 try:
                     if filename:
                         if vfs:
                             fh = vfs.open(filename, "wb")
                         else:
                             # Increase default buffer size because default is usually
                             # small (4k is common on Linux).
                             fh = open(filename, "wb", 131072)
                     else:
                         fd, filename = pycompat.mkstemp(prefix="hg-bundle-", suffix=".hg")
                         fh = os.fdopen(fd, r"wb")
                     cleanup = filename
                     for c in chunks:
                         fh.write(c)
                     cleanup = None
                     return filename
                 finally:
                     if fh is not None:
                         fh.close()
                     if cleanup is not None:
                         if filename and vfs:
                             vfs.unlink(cleanup)
                         else:
                             os.unlink(cleanup)
             class cg1unpacker(object):
                 """Unpacker for cg1 changegroup streams.
                 A changegroup unpacker handles the framing of the revision data in
                 the wire format. Most consumers will want to use the apply()
                 method to add the changes from the changegroup to a repository.
                 If you're forwarding a changegroup unmodified to another consumer,
                 use getchunks(), which returns an iterator of changegroup
                 chunks. This is mostly useful for cases where you need to know the
                 data stream has ended by observing the end of the changegroup.
                 deltachunk() is useful only if you're applying delta data. Most
                 consumers should prefer apply() instead.
                 A few other public methods exist. Those are used only for
                 bundlerepo and some debug commands - their use is discouraged.
                 """
                 deltaheader = _CHANGEGROUPV1_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '01'
                 _grouplistcount = 1 # One list of files after the manifests
                 def __init__(self, fh, alg, extras=None):
                     if alg is None:
                         alg = 'UN'
                     if alg not in util.compengines.supportedbundletypes:
                         raise error.Abort(_('unknown stream compression type: %s')
                                          % alg)
                     if alg == 'BZ':
                         alg = '_truncatedBZ'
                     compengine = util.compengines.forbundletype(alg)
                     self._stream = compengine.decompressorreader(fh)
                     self._type = alg
                     self.extras = extras or {}
                     self.callback = None
                 # These methods (compressed, read, seek, tell) all appear to only
                 # be used by bundlerepo, but it's a little hard to tell.
                 def compressed(self):
                     return self._type is not None and self._type != 'UN'
                 def read(self, l):
                     return self._stream.read(l)
                 def seek(self, pos):
                     return self._stream.seek(pos)
                 def tell(self):
                     return self._stream.tell()
                 def close(self):
                     return self._stream.close()
                 def _chunklength(self):
                     d = readexactly(self._stream, 4)
                     l = struct.unpack(">l", d)[0]
                     if l <= 4:
                         if l:
                             raise error.Abort(_("invalid chunk length %d") % l)
                         return 0
                     if self.callback:
                         self.callback()
                     return l - 4
                 def changelogheader(self):
                     """v10 does not have a changelog header chunk"""
                     return {}
                 def manifestheader(self):
                     """v10 does not have a manifest header chunk"""
                     return {}
                 def filelogheader(self):
                     """return the header of the filelogs chunk, v10 only has the filename"""
                     l = self._chunklength()
                     if not l:
                         return {}
                     fname = readexactly(self._stream, l)
                     return {'filename': fname}
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, cs = headertuple
                     if prevnode is None:
                         deltabase = p1
                     else:
                         deltabase = prevnode
                     flags = 0
                     return node, p1, p2, deltabase, cs, flags
                 def deltachunk(self, prevnode):
                     l = self._chunklength()
                     if not l:
                         return {}
                     headerdata = readexactly(self._stream, self.deltaheadersize)
                     header = struct.unpack(self.deltaheader, headerdata)
                     delta = readexactly(self._stream, l - self.deltaheadersize)
                     node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)
                     return (node, p1, p2, cs, deltabase, delta, flags)
                 def getchunks(self):
                     """returns all the chunks contains in the bundle
                     Used when you need to forward the binary stream to a file or another
                     network API. To do so, it parse the changegroup data, otherwise it will
                     block in case of sshrepo because it don't know the end of the stream.
                     """
                     # For changegroup 1 and 2, we expect 3 parts: changelog, manifestlog,
                     # and a list of filelogs. For changegroup 3, we expect 4 parts:
                     # changelog, manifestlog, a list of tree manifestlogs, and a list of
                     # filelogs.
                     #
                     # Changelog and manifestlog parts are terminated with empty chunks. The
                     # tree and file parts are a list of entry sections. Each entry section
                     # is a series of chunks terminating in an empty chunk. The list of these
                     # entry sections is terminated in yet another empty chunk, so we know
                     # we've reached the end of the tree/file list when we reach an empty
                     # chunk that was proceeded by no non-empty chunks.
                     parts = 0
                     while parts < 2 + self._grouplistcount:
                         noentries = True
                         while True:
                             chunk = getchunk(self)
                             if not chunk:
                                 # The first two empty chunks represent the end of the
                                 # changelog and the manifestlog portions. The remaining
                                 # empty chunks represent either A) the end of individual
                                 # tree or file entries in the file list, or B) the end of
                                 # the entire list. It's the end of the entire list if there
                                 # were no entries (i.e. noentries is True).
                                 if parts < 2:
                                     parts += 1
                                 elif noentries:
                                     parts += 1
                                 break
                             noentries = False
                             yield chunkheader(len(chunk))
                             pos = 0
                             while pos < len(chunk):
                                 next = pos + 2**20
                                 yield chunk[pos:next]
                                 pos = next
                         yield closechunk()
                 def _unpackmanifests(self, repo, revmap, trp, prog):
                     self.callback = prog.increment
                     # no need to check for empty manifest group here:
                     # if the result of the merge of 1 and 2 is the same in 3 and 4,
                     # no new manifest will be created and the manifest group will
                     # be empty during the pull
                     self.manifestheader()
                     deltas = self.deltaiter()
                     repo.manifestlog._revlog.addgroup(deltas, revmap, trp)
                     prog.complete()
                     self.callback = None
                 def apply(self, repo, tr, srctype, url, targetphase=phases.draft,
                           expectedtotal=None):
                     """Add the changegroup returned by source.read() to this repo.
                     srctype is a string like 'push', 'pull', or 'unbundle'.  url is
                     the URL of the repo where this changegroup is coming from.
                     Return an integer summarizing the change to this repo:
                     - nothing changed or no source: 0
                     - more heads than before: 1+added heads (2..n)
                     - fewer heads than before: -1-removed heads (-2..-n)
                     - number of heads stays the same: 1
                     """
                     repo = repo.unfiltered()
                     def csmap(x):
                         repo.ui.debug("add changeset %s\n" % short(x))
                         return len(cl)
                     def revmap(x):
                         return cl.rev(x)
                     changesets = files = revisions = 0
                     try:
                         # The transaction may already carry source information. In this
                         # case we use the top level data. We overwrite the argument
                         # because we need to use the top level value (if they exist)
                         # in this function.
                         srctype = tr.hookargs.setdefault('source', srctype)
                         url = tr.hookargs.setdefault('url', url)
                         repo.hook('prechangegroup',
                                   throw=True, **pycompat.strkwargs(tr.hookargs))
                         # write changelog data to temp files so concurrent readers
                         # will not see an inconsistent view
                         cl = repo.changelog
                         cl.delayupdate(tr)
                         oldheads = set(cl.heads())
                         trp = weakref.proxy(tr)
                         # pull off the changeset group
                         repo.ui.status(_("adding changesets\n"))
                         clstart = len(cl)
                         progress = repo.ui.makeprogress(_('changesets'), unit=_('chunks'),
                                                         total=expectedtotal)
                         self.callback = progress.increment
                         efiles = set()
                         def onchangelog(cl, node):
                             efiles.update(cl.readfiles(node))
                         self.changelogheader()
                         deltas = self.deltaiter()
                         cgnodes = cl.addgroup(deltas, csmap, trp, addrevisioncb=onchangelog)
                         efiles = len(efiles)
                         if not cgnodes:
                             repo.ui.develwarn('applied empty changegroup',
                                               config='warn-empty-changegroup')
                         clend = len(cl)
                         changesets = clend - clstart
                         progress.complete()
                         self.callback = None
                         # pull off the manifest group
                         repo.ui.status(_("adding manifests\n"))
                         # We know that we'll never have more manifests than we had
                         # changesets.
                         progress = repo.ui.makeprogress(_('manifests'), unit=_('chunks'),
                                                         total=changesets)
                         self._unpackmanifests(repo, revmap, trp, progress)
                         needfiles = {}
                         if repo.ui.configbool('server', 'validate'):
                             cl = repo.changelog
                             ml = repo.manifestlog
                             # validate incoming csets have their manifests
                             for cset in xrange(clstart, clend):
                                 mfnode = cl.changelogrevision(cset).manifest
                                 mfest = ml[mfnode].readdelta()
                                 # store file cgnodes we must see
                                 for f, n in mfest.iteritems():
                                     needfiles.setdefault(f, set()).add(n)
                         # process the files
                         repo.ui.status(_("adding file changes\n"))
                         newrevs, newfiles = _addchangegroupfiles(
                             repo, self, revmap, trp, efiles, needfiles)
                         revisions += newrevs
                         files += newfiles
                         deltaheads = 0
                         if oldheads:
                             heads = cl.heads()
                             deltaheads = len(heads) - len(oldheads)
                             for h in heads:
                                 if h not in oldheads and repo[h].closesbranch():
                                     deltaheads -= 1
                         htext = ""
                         if deltaheads:
                             htext = _(" (%+d heads)") % deltaheads
                         repo.ui.status(_("added %d changesets"
                                          " with %d changes to %d files%s\n")
                                          % (changesets, revisions, files, htext))
                         repo.invalidatevolatilesets()
                         if changesets > 0:
                             if 'node' not in tr.hookargs:
                                 tr.hookargs['node'] = hex(cl.node(clstart))
                                 tr.hookargs['node_last'] = hex(cl.node(clend - 1))
                                 hookargs = dict(tr.hookargs)
                             else:
                                 hookargs = dict(tr.hookargs)
                                 hookargs['node'] = hex(cl.node(clstart))
                                 hookargs['node_last'] = hex(cl.node(clend - 1))
                             repo.hook('pretxnchangegroup',
                                       throw=True, **pycompat.strkwargs(hookargs))
                         added = [cl.node(r) for r in xrange(clstart, clend)]
                         phaseall = None
                         if srctype in ('push', 'serve'):
                             # Old servers can not push the boundary themselves.
                             # New servers won't push the boundary if changeset already
                             # exists locally as secret
                             #
                             # We should not use added here but the list of all change in
                             # the bundle
                             if repo.publishing():
                                 targetphase = phaseall = phases.public
                             else:
                                 # closer target phase computation
                                 # Those changesets have been pushed from the
                                 # outside, their phases are going to be pushed
                                 # alongside. Therefor `targetphase` is
                                 # ignored.
                                 targetphase = phaseall = phases.draft
                         if added:
                             phases.registernew(repo, tr, targetphase, added)
                         if phaseall is not None:
                             phases.advanceboundary(repo, tr, phaseall, cgnodes)
                         if changesets > 0:
                             def runhooks():
                                 # These hooks run when the lock releases, not when the
                                 # transaction closes. So it's possible for the changelog
                                 # to have changed since we last saw it.
                                 if clstart >= len(repo):
                                     return
                                 repo.hook("changegroup", **pycompat.strkwargs(hookargs))
                                 for n in added:
                                     args = hookargs.copy()
                                     args['node'] = hex(n)
                                     del args['node_last']
                                     repo.hook("incoming", **pycompat.strkwargs(args))
                                 newheads = [h for h in repo.heads()
                                             if h not in oldheads]
                                 repo.ui.log("incoming",
                                             "%d incoming changes - new heads: %s\n",
                                             len(added),
                                             ', '.join([hex(c[:6]) for c in newheads]))
                             tr.addpostclose('changegroup-runhooks-%020i' % clstart,
                                             lambda tr: repo._afterlock(runhooks))
                     finally:
                         repo.ui.flush()
                     # never return 0 here:
                     if deltaheads < 0:
                         ret = deltaheads - 1
                     else:
                         ret = deltaheads + 1
                     return ret
                 def deltaiter(self):
                     """
                     returns an iterator of the deltas in this changegroup
                     Useful for passing to the underlying storage system to be stored.
                     """
                     chain = None
                     for chunkdata in iter(lambda: self.deltachunk(chain), {}):
                         # Chunkdata: (node, p1, p2, cs, deltabase, delta, flags)
                         yield chunkdata
                         chain = chunkdata[0]
             class cg2unpacker(cg1unpacker):
                 """Unpacker for cg2 streams.
                 cg2 streams add support for generaldelta, so the delta header
                 format is slightly different. All other features about the data
                 remain the same.
                 """
                 deltaheader = _CHANGEGROUPV2_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '02'
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, deltabase, cs = headertuple
                     flags = 0
                     return node, p1, p2, deltabase, cs, flags
             class cg3unpacker(cg2unpacker):
                 """Unpacker for cg3 streams.
                 cg3 streams add support for exchanging treemanifests and revlog
                 flags. It adds the revlog flags to the delta header and an empty chunk
                 separating manifests and files.
                 """
                 deltaheader = _CHANGEGROUPV3_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '03'
                 _grouplistcount = 2 # One list of manifests and one list of files
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, deltabase, cs, flags = headertuple
                     return node, p1, p2, deltabase, cs, flags
                 def _unpackmanifests(self, repo, revmap, trp, prog):
                     super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog)
                     for chunkdata in iter(self.filelogheader, {}):
                         # If we get here, there are directory manifests in the changegroup
                         d = chunkdata["filename"]
                         repo.ui.debug("adding %s revisions\n" % d)
                         dirlog = repo.manifestlog._revlog.dirlog(d)
                         deltas = self.deltaiter()
                         if not dirlog.addgroup(deltas, revmap, trp):
                             raise error.Abort(_("received dir revlog group is empty"))
             class headerlessfixup(object):
                 def __init__(self, fh, h):
                     self._h = h
                     self._fh = fh
                 def read(self, n):
                     if self._h:
                         d, self._h = self._h[:n], self._h[n:]
                         if len(d) < n:
                             d += readexactly(self._fh, n - len(d))
                         return d
                     return readexactly(self._fh, n)
             class cg1packer(object):
                 deltaheader = _CHANGEGROUPV1_DELTA_HEADER
                 version = '01'
                 def __init__(self, repo, bundlecaps=None):
                     """Given a source repo, construct a bundler.
                     bundlecaps is optional and can be used to specify the set of
                     capabilities which can be used to build the bundle. While bundlecaps is
                     unused in core Mercurial, extensions rely on this feature to communicate
                     capabilities to customize the changegroup packer.
                     """
                     # Set of capabilities we can use to build the bundle.
                     if bundlecaps is None:
                         bundlecaps = set()
                     self._bundlecaps = bundlecaps
                     # experimental config: bundle.reorder
                     reorder = repo.ui.config('bundle', 'reorder')
                     if reorder == 'auto':
                         reorder = None
                     else:
                         reorder = stringutil.parsebool(reorder)
                     self._repo = repo
                     self._reorder = reorder
                     self._progress = repo.ui.progress
                     if self._repo.ui.verbose and not self._repo.ui.debugflag:
                         self._verbosenote = self._repo.ui.note
                     else:
                         self._verbosenote = lambda s: None
                 def close(self):
                     return closechunk()
                 def fileheader(self, fname):
                     return chunkheader(len(fname)) + fname
                 # Extracted both for clarity and for overriding in extensions.
                 def _sortgroup(self, revlog, nodelist, lookup):
                     """Sort nodes for change group and turn them into revnums."""
                     # for generaldelta revlogs, we linearize the revs; this will both be
                     # much quicker and generate a much smaller bundle
                     if (revlog._generaldelta and self._reorder is None) or self._reorder:
                         dag = dagutil.revlogdag(revlog)
                         return dag.linearize(set(revlog.rev(n) for n in nodelist))
                     else:
                         return sorted([revlog.rev(n) for n in nodelist])
                 def group(self, nodelist, revlog, lookup, units=None):
                     """Calculate a delta group, yielding a sequence of changegroup chunks
                     (strings).
                     Given a list of changeset revs, return a set of deltas and
                     metadata corresponding to nodes. The first delta is
                     first parent(nodelist[0]) -> nodelist[0], the receiver is
                     guaranteed to have this parent as it has all history before
                     these changesets. In the case firstparent is nullrev the
                     changegroup starts with a full revision.
                     If units is not None, progress detail will be generated, units specifies
                     the type of revlog that is touched (changelog, manifest, etc.).
                     """
                     # if we don't have any revisions touched by these changesets, bail
                     if len(nodelist) == 0:
                         yield self.close()
                         return
                     revs = self._sortgroup(revlog, nodelist, lookup)
                     # add the parent of the first rev
                     p = revlog.parentrevs(revs[0])[0]
                     revs.insert(0, p)
                     # build deltas
                     total = len(revs) - 1
                     msgbundling = _('bundling')
                     for r in xrange(len(revs) - 1):
                         if units is not None:
                             self._progress(msgbundling, r + 1, unit=units, total=total)
                         prev, curr = revs[r], revs[r + 1]
                         linknode = lookup(revlog.node(curr))
                         for c in self.revchunk(revlog, curr, prev, linknode):
                             yield c
                     if units is not None:
                         self._progress(msgbundling, None)
                     yield self.close()
                 # filter any nodes that claim to be part of the known set
                 def prune(self, revlog, missing, commonrevs):
                     rr, rl = revlog.rev, revlog.linkrev
                     return [n for n in missing if rl(rr(n)) not in commonrevs]
                 def _packmanifests(self, dir, mfnodes, lookuplinknode):
                     """Pack flat manifests into a changegroup stream."""
                     assert not dir
                     for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,
                                             lookuplinknode, units=_('manifests')):
                         yield chunk
                 def _manifestsdone(self):
                     return ''
                 def generate(self, commonrevs, clnodes, fastpathlinkrev, source):
                     '''yield a sequence of changegroup chunks (strings)'''
                     repo = self._repo
                     cl = repo.changelog
                     clrevorder = {}
                     mfs = {} # needed manifests
                     fnodes = {} # needed file nodes
                     changedfiles = set()
                     # Callback for the changelog, used to collect changed files and manifest
                     # nodes.
                     # Returns the linkrev node (identity in the changelog case).
                     def lookupcl(x):
                         c = cl.read(x)
                         clrevorder[x] = len(clrevorder)
                         n = c[0]
                         # record the first changeset introducing this manifest version
                         mfs.setdefault(n, x)
                         # Record a complete list of potentially-changed files in
                         # this manifest.
                         changedfiles.update(c[3])
                         return x
                     self._verbosenote(_('uncompressed size of bundle content:\n'))
                     size = 0
                     for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):
                         size += len(chunk)
                         yield chunk
                     self._verbosenote(_('%8.i (changelog)\n') % size)
                     # We need to make sure that the linkrev in the changegroup refers to
                     # the first changeset that introduced the manifest or file revision.
                     # The fastpath is usually safer than the slowpath, because the filelogs
                     # are walked in revlog order.
                     #
                     # When taking the slowpath with reorder=None and the manifest revlog
                     # uses generaldelta, the manifest may be walked in the "wrong" order.
                     # Without 'clrevorder', we would get an incorrect linkrev (see fix in
                     # cc0ff93d0c0c).
                     #
                     # When taking the fastpath, we are only vulnerable to reordering
                     # of the changelog itself. The changelog never uses generaldelta, so
                     # it is only reordered when reorder=True. To handle this case, we
                     # simply take the slowpath, which already has the 'clrevorder' logic.
                     # This was also fixed in cc0ff93d0c0c.
                     fastpathlinkrev = fastpathlinkrev and not self._reorder
                     # Treemanifests don't work correctly with fastpathlinkrev
                     # either, because we don't discover which directory nodes to
                     # send along with files. This could probably be fixed.
                     fastpathlinkrev = fastpathlinkrev and (
                         'treemanifest' not in repo.requirements)
                     for chunk in self.generatemanifests(commonrevs, clrevorder,
                             fastpathlinkrev, mfs, fnodes, source):
                         yield chunk
                     mfs.clear()
                     clrevs = set(cl.rev(x) for x in clnodes)
                     if not fastpathlinkrev:
                         def linknodes(unused, fname):
                             return fnodes.get(fname, {})
                     else:
                         cln = cl.node
                         def linknodes(filerevlog, fname):
                             llr = filerevlog.linkrev
                             fln = filerevlog.node
                             revs = ((r, llr(r)) for r in filerevlog)
                             return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)
                     for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,
                                                     source):
                         yield chunk
                     yield self.close()
                     if clnodes:
                         repo.hook('outgoing', node=hex(clnodes[0]), source=source)
                 def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,
                                       fnodes, source):
                     """Returns an iterator of changegroup chunks containing manifests.
                     `source` is unused here, but is used by extensions like remotefilelog to
                     change what is sent based in pulls vs pushes, etc.
                     """
                     repo = self._repo
                     mfl = repo.manifestlog
                     dirlog = mfl._revlog.dirlog
                     tmfnodes = {'': mfs}
                     # Callback for the manifest, used to collect linkrevs for filelog
                     # revisions.
                     # Returns the linkrev node (collected in lookupcl).
                     def makelookupmflinknode(dir, nodes):
                         if fastpathlinkrev:
                             assert not dir
                             return mfs.__getitem__
                         def lookupmflinknode(x):
                             """Callback for looking up the linknode for manifests.
                             Returns the linkrev node for the specified manifest.
                             SIDE EFFECT:
 ) fclnodes gets populated with the list of relevant
                                file nodes if we're not using fastpathlinkrev
 ) When treemanifests are in use, collects treemanifest nodes
                                to send
                             Note that this means manifests must be completely sent to
                             the client before you can trust the list of files and
                             treemanifests to send.
                             """
                             clnode = nodes[x]
                             mdata = mfl.get(dir, x).readfast(shallow=True)
                             for p, n, fl in mdata.iterentries():
                                 if fl == 't': # subdirectory manifest
                                     subdir = dir + p + '/'
                                     tmfclnodes = tmfnodes.setdefault(subdir, {})
                                     tmfclnode = tmfclnodes.setdefault(n, clnode)
                                     if clrevorder[clnode] < clrevorder[tmfclnode]:
                                         tmfclnodes[n] = clnode
                                 else:
                                     f = dir + p
                                     fclnodes = fnodes.setdefault(f, {})
                                     fclnode = fclnodes.setdefault(n, clnode)
                                     if clrevorder[clnode] < clrevorder[fclnode]:
                                         fclnodes[n] = clnode
                             return clnode
                         return lookupmflinknode
                     size = 0
                     while tmfnodes:
                         dir, nodes = tmfnodes.popitem()
                         prunednodes = self.prune(dirlog(dir), nodes, commonrevs)
                         if not dir or prunednodes:
                             for x in self._packmanifests(dir, prunednodes,
                                                          makelookupmflinknode(dir, nodes)):
                                 size += len(x)
                                 yield x
                     self._verbosenote(_('%8.i (manifests)\n') % size)
                     yield self._manifestsdone()
                 # The 'source' parameter is useful for extensions
                 def generatefiles(self, changedfiles, linknodes, commonrevs, source):
                     repo = self._repo
                     progress = self._progress
                     msgbundling = _('bundling')
                     total = len(changedfiles)
                     # for progress output
                     msgfiles = _('files')
                     for i, fname in enumerate(sorted(changedfiles)):
                         filerevlog = repo.file(fname)
                         if not filerevlog:
                             raise error.Abort(_("empty or missing file data for %s") %
                                               fname)
                         linkrevnodes = linknodes(filerevlog, fname)
                         # Lookup for filenodes, we collected the linkrev nodes above in the
                         # fastpath case and with lookupmf in the slowpath case.
                         def lookupfilelog(x):
                             return linkrevnodes[x]
                         filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)
                         if filenodes:
                             progress(msgbundling, i + 1, item=fname, unit=msgfiles,
                                      total=total)
                             h = self.fileheader(fname)
                             size = len(h)
                             yield h
                             for chunk in self.group(filenodes, filerevlog, lookupfilelog):
                                 size += len(chunk)
                                 yield chunk
                             self._verbosenote(_('%8.i  %s\n') % (size, fname))
                     progress(msgbundling, None)
                 def deltaparent(self, revlog, rev, p1, p2, prev):
                     if not revlog.candelta(prev, rev):
                         raise error.ProgrammingError('cg1 should not be used in this case')
                     return prev
                 def revchunk(self, revlog, rev, prev, linknode):
                     node = revlog.node(rev)
                     p1, p2 = revlog.parentrevs(rev)
                     base = self.deltaparent(revlog, rev, p1, p2, prev)
                     prefix = ''
                     if revlog.iscensored(base) or revlog.iscensored(rev):
                         try:
                             delta = revlog.revision(node, raw=True)
                         except error.CensoredNodeError as e:
                             delta = e.tombstone
                         if base == nullrev:
                             prefix = mdiff.trivialdiffheader(len(delta))
                         else:
                             baselen = revlog.rawsize(base)
                             prefix = mdiff.replacediffheader(baselen, len(delta))
                     elif base == nullrev:
                         delta = revlog.revision(node, raw=True)
                         prefix = mdiff.trivialdiffheader(len(delta))
                     else:
                         delta = revlog.revdiff(base, rev)
                     p1n, p2n = revlog.parents(node)
                     basenode = revlog.node(base)
                     flags = revlog.flags(rev)
                     meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)
                     meta += prefix
                     l = len(meta) + len(delta)
                     yield chunkheader(l)
                     yield meta
                     yield delta
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     # do nothing with basenode, it is implicitly the previous one in HG10
                     # do nothing with flags, it is implicitly 0 for cg1 and cg2
                     return struct.pack(self.deltaheader, node, p1n, p2n, linknode)
             class cg2packer(cg1packer):
                 version = '02'
                 deltaheader = _CHANGEGROUPV2_DELTA_HEADER
                 def __init__(self, repo, bundlecaps=None):
                     super(cg2packer, self).__init__(repo, bundlecaps)
                     if self._reorder is None:
                         # Since generaldelta is directly supported by cg2, reordering
                         # generally doesn't help, so we disable it by default (treating
                         # bundle.reorder=auto just like bundle.reorder=False).
                         self._reorder = False
                 def deltaparent(self, revlog, rev, p1, p2, prev):
                     dp = revlog.deltaparent(rev)
                     if dp == nullrev and revlog.storedeltachains:
                         # Avoid sending full revisions when delta parent is null. Pick prev
                         # in that case. It's tempting to pick p1 in this case, as p1 will
                         # be smaller in the common case. However, computing a delta against
                         # p1 may require resolving the raw text of p1, which could be
                         # expensive. The revlog caches should have prev cached, meaning
                         # less CPU for changegroup generation. There is likely room to add
                         # a flag and/or config option to control this behavior.
                         base = prev
                     elif dp == nullrev:
                         # revlog is configured to use full snapshot for a reason,
                         # stick to full snapshot.
                         base = nullrev
                     elif dp not in (p1, p2, prev):
                         # Pick prev when we can't be sure remote has the base revision.
                         return prev
                     else:
                         base = dp
                     if base != nullrev and not revlog.candelta(base, rev):
                         base = nullrev
                     return base
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     # Do nothing with flags, it is implicitly 0 in cg1 and cg2
                     return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)
             class cg3packer(cg2packer):
                 version = '03'
                 deltaheader = _CHANGEGROUPV3_DELTA_HEADER
                 def _packmanifests(self, dir, mfnodes, lookuplinknode):
                     if dir:
                         yield self.fileheader(dir)
                     dirlog = self._repo.manifestlog._revlog.dirlog(dir)
                     for chunk in self.group(mfnodes, dirlog, lookuplinknode,
                                             units=_('manifests')):
                         yield chunk
                 def _manifestsdone(self):
                     return self.close()
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     return struct.pack(
                         self.deltaheader, node, p1n, p2n, basenode, linknode, flags)
             _packermap = {'01': (cg1packer, cg1unpacker),
                          # cg2 adds support for exchanging generaldelta
                          '02': (cg2packer, cg2unpacker),
                          # cg3 adds support for exchanging revlog flags and treemanifests
                          '03': (cg3packer, cg3unpacker),
             }
             def allsupportedversions(repo):
                 versions = set(_packermap.keys())
                 if not (repo.ui.configbool('experimental', 'changegroup3') or
                         repo.ui.configbool('experimental', 'treemanifest') or
                         'treemanifest' in repo.requirements):
                     versions.discard('03')
                 return versions
             # Changegroup versions that can be applied to the repo
             def supportedincomingversions(repo):
                 return allsupportedversions(repo)
             # Changegroup versions that can be created from the repo
             def supportedoutgoingversions(repo):
                 versions = allsupportedversions(repo)
                 if 'treemanifest' in repo.requirements:
                     # Versions 01 and 02 support only flat manifests and it's just too
                     # expensive to convert between the flat manifest and tree manifest on
                     # the fly. Since tree manifests are hashed differently, all of history
                     # would have to be converted. Instead, we simply don't even pretend to
                     # support versions 01 and 02.
                     versions.discard('01')
                     versions.discard('02')
                 if NARROW_REQUIREMENT in repo.requirements:
                     # Versions 01 and 02 don't support revlog flags, and we need to
                     # support that for stripping and unbundling to work.
                     versions.discard('01')
                     versions.discard('02')
                 if LFS_REQUIREMENT in repo.requirements:
                     # Versions 01 and 02 don't support revlog flags, and we need to
                     # mark LFS entries with REVIDX_EXTSTORED.
                     versions.discard('01')
                     versions.discard('02')
                 return versions
             def localversion(repo):
                 # Finds the best version to use for bundles that are meant to be used
                 # locally, such as those from strip and shelve, and temporary bundles.
                 return max(supportedoutgoingversions(repo))
             def safeversion(repo):
                 # Finds the smallest version that it's safe to assume clients of the repo
                 # will support. For example, all hg versions that support generaldelta also
                 # support changegroup 02.
                 versions = supportedoutgoingversions(repo)
                 if 'generaldelta' in repo.requirements:
                     versions.discard('01')
                 assert versions
                 return min(versions)
             def getbundler(version, repo, bundlecaps=None):
                 assert version in supportedoutgoingversions(repo)
                 return _packermap[version][0](repo, bundlecaps)
             def getunbundler(version, fh, alg, extras=None):
                 return _packermap[version][1](fh, alg, extras=extras)
             def _changegroupinfo(repo, nodes, source):
                 if repo.ui.verbose or source == 'bundle':
                     repo.ui.status(_("%d changesets found\n") % len(nodes))
                 if repo.ui.debugflag:
                     repo.ui.debug("list of changesets:\n")
                     for node in nodes:
                         repo.ui.debug("%s\n" % hex(node))
             def makechangegroup(repo, outgoing, version, source, fastpath=False,
                                 bundlecaps=None):
                 cgstream = makestream(repo, outgoing, version, source,
                                       fastpath=fastpath, bundlecaps=bundlecaps)
                 return getunbundler(version, util.chunkbuffer(cgstream), None,
                                     {'clcount': len(outgoing.missing) })
             def makestream(repo, outgoing, version, source, fastpath=False,
                            bundlecaps=None):
                 bundler = getbundler(version, repo, bundlecaps=bundlecaps)
                 repo = repo.unfiltered()
                 commonrevs = outgoing.common
                 csets = outgoing.missing
                 heads = outgoing.missingheads
                 # We go through the fast path if we get told to, or if all (unfiltered
                 # heads have been requested (since we then know there all linkrevs will
                 # be pulled by the client).
                 heads.sort()
                 fastpathlinkrev = fastpath or (
                         repo.filtername is None and heads == sorted(repo.heads()))
                 repo.hook('preoutgoing', throw=True, source=source)
                 _changegroupinfo(repo, csets, source)
                 return bundler.generate(commonrevs, csets, fastpathlinkrev, source)
             def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):
                 revisions = 0
                 files = 0
+                progress = repo.ui.makeprogress(_('files'), unit=_('files'),
+                                                total=expectedfiles)
                 for chunkdata in iter(source.filelogheader, {}):
                     files += 1
                     f = chunkdata["filename"]
                     repo.ui.debug("adding %s revisions\n" % f)
-                    repo.ui.progress(_('files'), files, unit=_('files'),
+                    progress.increment()
-                                     total=expectedfiles)
                     fl = repo.file(f)
                     o = len(fl)
                     try:
                         deltas = source.deltaiter()
                         if not fl.addgroup(deltas, revmap, trp):
                             raise error.Abort(_("received file revlog group is empty"))
                     except error.CensoredBaseError as e:
                         raise error.Abort(_("received delta base is censored: %s") % e)
                     revisions += len(fl) - o
                     if f in needfiles:
                         needs = needfiles[f]
                         for new in xrange(o, len(fl)):
                             n = fl.node(new)
                             if n in needs:
                                 needs.remove(n)
                             else:
                                 raise error.Abort(
                                     _("received spurious file revlog entry"))
                         if not needs:
                             del needfiles[f]
-                repo.ui.progress(_('files'), None)
+                progress.complete()
                 for f, needs in needfiles.iteritems():
                     fl = repo.file(f)
                     for n in needs:
                         try:
                             fl.rev(n)
                         except error.LookupError:
                             raise error.Abort(
                                 _('missing file data for %s:%s - run hg verify') %
                                 (f, hex(n)))
                 return revisions, files